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(57) Abstract: The invention concerns 
an offline reorganization management in 
a set of indexed databases, in particular 
of the tablespace type, of an information 
computer system comprising the following 
steps: (10): continuously maintaining 
a list (PRIOREORG) of objects to be 
reorganized in descending order of 
priority; (20) executing a process (IDPOR) 
of identification of the next object to be 
reorganized (POR) in the absence of any 
reappraisal event (RAZ) and comprising 
the following steps: (21) establishing 
a rapid reorganization planning (PRR) 
using the list (PRIOREORG) and residual 
operational time (TRR) and a selection 
list (SELECT) of objects (OR); (22) 
establishing reorganization retroactive 
planning with LIFO memory storage of 
objects extracted from the list (SELECT); 
(23) identifying the available processing 
zone (RTR) to reorganize the object 
(POR); (24) writing (POR) when the zone 
(RTR) is cleared in the absence of any 
event (RAZ); and re-executing the process 
(IDPOR). 
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(57) Abrege : La m^thode de gestion des reorganisations " hors ligne " dans un ensemble de bases de donnees indexees, notamment 
de type espace de tables, d'un systeme informatique d' information comporte les operations suivantes :(10) - Maintien en continu 
d'une liste PRIOREORG des objets a reorganiser par priority decroissante; (20) - Execution du processus IDPOR d'identification 
du prochain objet a reorganiser POR en T absence d'evgnement de remise en cause RAZ et comportant les Stapes suivantes : (21) - 
Etablissement d*un planning rapide de reorganisation PRR a l'aide de PRIOREORG et du temps operationnel residuel TRR et d'une 
liste de selection SELECT d* objets OR;(22) - Etablissement d'un r£troplanning de reorganisation avec placement en m6moire LIFO 
des objets extraits de la liste SELECT ; (23) - Identification de la region de traitement RTR disponible pour rSorganiser T objet POR 
; (24) - Inscription de POR au planning de la region identifiee ;(30) - Lancement reorganisation de POR des liberation de la region 
RTR en 1' absence de tout evenement RAZ; et re-ex^cution du processus IDPOR. 
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METHODE DE GESTION DES REORGANISATIONS DANS 
UN ENSEMBLE DE BASES DE DONNEES INDEXEES 
D'UN SYSTEME INFORMATIQUE 



La presente invention concerne ta reorganisation de bases de donnees gerees & 
t'aide d'un systeme informatique, plus particulierement les bases de donnees indexes 
5 dans lesquelles un index, le plus souvent sous forme de table d'index, est utilise pour 
acc6der a un objet recherche, par exemple une ligne de la base de donnSes. Ces bases 
de donnees peuvent etre de trds grande taille. Pour fixer les idees et sans caractere 
limitatif pour la presentation de I'invention la taille de ces bases de donnees de tres 
grandes tailles peut aller de un million & quelques milliards de lignes. Ces bases de 

10 donnees sont en general enregistr6es dans des memoires de grande capacite, par 
exemple des memoires & disque, chaque ligne de donn6es etant adress£e de fa?on 
appropriee. Les tailles considerables que peuvent avoir les bases de donnees 
requierent souvent I'exploitation de ces derniferes par partitions auxquelles sont 
associes des index de partitions specifiques et/ou les index de bases de donnees 

15 completes. 

II est capital, pour maintenir la capacity d'une base de donnees £ etre consults 
par une connexion en ligne (on line) avec un temps d'accds aux donnees raisonnable, 
malgre I'effet retardateur du aux mises £ jour pratiquSes sur la base, de proceder 3 
des reorganisations p6riodiques de cette base de donnees. 

20 La reorganisation est une etape essentielle dans I'entretien des bases de donnees 

(et de leurs index). La reorganisation est faite hors ligne (off line) en general pendant la 
fen§tre de maintenance (fen£tre « batch ») et consiste d decharger la base de donnees, 
£ ranger ses lignes d'information dans un ordre souhaite, par exemple I'ordre 
alphabetique, puis & recharger les lignes une fois rangees dans la base de donnees en 

25 mettant a jour les index, si possible de fa?on reorganisee. 

Pour la suite de I'expose on appellera indistinctement « objet d reorganiser» OR 
un objet susceptible de reorganisation d'un systeme d'information, en particulier la 
base de donnee seule, son ou ses index, I'association base de donnees et index, les 
partitions de la bases de donnees, leurs index associes (specifiques ou non) et les 

30 associations partitions et leurs index. 

De meme pour la suite de I'expose, on appellera systeme informatique 
d'information ou systeme d'information un systeme informatique complet (materiels et 
logiciels) adapte pour la gestion de bases de donnees et comportant au moins une 
base de donnees. On rencontre de tels systemes notamment comme serveurs en ligne 

35 (on line) internes ou externes auxquels des utilisateurs se connectent pour consulter 
les bases de donnees correspondantes par I'intermediaire de requ§tes et autres 
demandes de recherche de donnees. 
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Les capacites « machine » du systdme d' information (unites centrales 
eventuellement mises en reseau) sont en general divisees en regions de traitement 
distinctes pilotees de fa?on unitaire par une region de contr6le. A chaque region de 
traitement sont affectees un certain nombre de tSches ordonn6es (programmes ou 
5 sous-programmes £ executer) et sont aliouees les ressources materielles necessaires 
en mSmoires virtuelles et periph6riques (disques durs, imprimantes, m6moires sur 
supports externes etc.). Par souci d'efficacite en execution et en allocation de 
ressources materielles et/ou logicielles on affecte si possible d chaque region de 
traitement des tSches de m§me type, telles que par exemple pour des taches 

10 g§n6ralement executables dans la fen§tre de maintenance dite fenetre « batch », des 
reorganisations de fichiers ou bases de donn6es (demandant beaucoup d'espace de 
disque) ou des copies images de fichiers (demandant des p6ripheriques de sortie 
externe, lecteurs de bandes magn6tiques, lecteurs/graveurs de CD-ROM, etc.). 

D'une fagon g6n6rale les reorganisations de bases de donnees sont necessaires 

15 pour eviter que les performances des transactions (lecture et/ou mise & jour) accedant 
aux bases de donnees ne se degradent. Toutefois il n'est pas possible de maintenir 
tous les objets d'un systeme d'information en etat de parfaite organisation parce que : 
i) les reorganisations consomment du temps et des ressources du systeme 
(processeurs, memoire vive et m§moires sur disques); 

20 ii) des reorganisations trop fr6quentes entraineraient des couts de realisations 
superieurs aux surcoOts g£r\6r6s par Texploitation de bases de donnees faiblement 
desorganisees. 

Une premiere etape du travail de gestion de la reorganisation d'un ensemble de 
bases de donnees consiste en reiaboration d'un planning d'execution des 
25 reorganisations. Ce planning est utilise pour le lancement des reorganisations des 
bases de donn6es hors ligne (off line) pendant la periode de maintenance journaliere 
de quelques heures prevue pour le systeme d'information (fenetre « batch » ou fen§tre 
des executions groupees). 

On connatt des outils logiciels susceptibles de g6n6rer le planning d'ex6cution des 
30 reorganisations d venir en fonction : 

• de la liste des objets a r6organiser, 

- de la frequence predeterminee de reorganisation par objet, 

• du niveau de desorganisation des objets mesure par des techniques non 
documentees. 

35 Toutefois aucun des outils connus ne remet en cause le planning initial en fonction 

d'evenements pouvant survenir pendant Pexecution des reorganisations planifiees. 
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Accessoirement aucun de ces outils ne pretend proceder a une etude 
d'optimisation pour generer ce planning, notamment £ partir des ressources 
materielles et logicielles disponibles instantan6ment et/ou a partir des couts de 
reorganisation et/ou de non-r6organisation ou en fonction de paramdtres instantanes 
5 reels ou estim6s des objets & reorganiser tels que leur taille, leur taux de 
desorganisation et leur temps de reorganisation. 

L'invention a pour but une gestion de la reorganisation d'un ensemble de bases de 
donnees indexees d'un systeme informatique d' information permettant d'am6liorer les 
performances d'une configuration donnee du systeme d'information par une recherche 
10 d'optimisation continuelle, notamment du point de vue coQts et/ou des temps de 
reorganisation des reorganisations des bases de donnees (et/ou leurs partitions) et de 
leurs index. 

A cette fin, l'invention propose une methode de gestion des reorganisations dans 
un ensemble de bases de donnees indexees d'un systeme informatique d'information 
15 adaptee £ la reorganisation « hors ligne» dans au moins une region de traitement de 
reorganisation du systeme et comportant les phases operationnelles suivantes (voir 
figure 1) : 

(10) - Creation et maintien par mise d jour en continu d'une liste PRIOREORG des 
objets & reorganiser par priorite decroissante fonction de retat de desorganisation des 
20 objets a reorganiser ; 

(20) - Execution du processus IDPOR d'identification du premier ou prochain objet 
d reorganiser POR avec, 3 chaque evenement RAZR=1 interne au systeme pour lequel 
la selection du premier ou prochain objet & reorganiser doit etre remise en cause, 
interruption et remise d z6ro et nouvelle execution du processus IDPOR, lequel 

25 processus comportant les etapes suivantes : 

(21) • Etablissement d'un planning rapide de reorganisation PRR 3 I'aide de la liste 
PRIOREORG et du temps operationnel r6siduel disponible TRR dans I'ensemble des 
regions de reorganisation et d'une liste de selection SELECT/OR d'objets d reorganiser 
OR ordonnes par priorites decroissantes optimisees en fonction du gain de la 

30 reorganisation de chaque objet OR, ledit gain etant defini comme le produit d'un 
facteur representatif du taux de desorganisation d'un objet OR par le temps de 
reorganisation de cet objet; 

(22) - Etablissement d'un retroplanning de reorganisation dans lequel pour tout 
objet courant d reorganiser OR extrait de la liste SELECT/OR par priorite croissante 

35 pour favoriser le traitement avance des objets de plus grandes tailles possibles, on 
calcule pour chaque region de reorganisation le dernier deiai de la region DDRR, 
repr6sentant dans la fen§tre « batch » allouee a la reorganisation « hors ligne » le 
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temps minimal nScessaire a la reorganisation de I'objet courant OR, egal dans le cas 
present d la duree de temps consomme DCRR plus le temps de reorganisation de 
I'objet courant DROR; 

(23) - Identification de la region de traitement RTR de I'objet courant OR par 
5 adequation optimisee entre la duree de traitement disponible dans ladite region DRR 

avec la duree de traitement DROR necessaire pour la reorganisation de I'objet OR avec 
DRR - DDRR minimal <0 ; 

(24) - Inscription de I'objet courant OR comme prochain objet a reorganiser POR 
au planning de la region identifiee en valorisant le pointeur POR correspondant & 

10 I'adresse de I'objet courant 3 reorganiser et en augmentant la dur6e de temps 
consomme DCRR dans la region du temps de la reorganisation DROR. 

(30) - Lancement de la reorganisation de I'objet POR d§s que la region de 
traitement de reorganisation RTR identifiee est liberee en ('absence de tout evenement 
RAZR=1 survenu entre temps ; Remise 3 z6ro et nouvelle execution du processus 

15 IDPOR. 

Ainsi I' introduction dans la methode de gestion selon I'invention du principe m§me 
du planning rapide de reorganisation PRR (dont le temps machine est minimal pour 
permettre des reactualisations frequentes sans veritable penalisation) et du principe de 
la reactualisation permanente du planning rapide de reorganisation PRR permet de 

20 prendre en compte immediatement revolution du systeme d'information complet et 
des ses principaux paramdtres (taux instantane de desorganisations des objets a 
reorganises allongement de la dur6e d'une reorganisation par rapport d la duree 
estimee, liberation d'une region de traitement, fin d'une tache de reorganisation, etc ) 
pour modifier les priorites des reorganisations et optimiser le lancement de celles-ci. 

25 A cote des reorganisations de fichiers tels que bases de donnees les copies 

des fichiers modifies constitue un imperatif de s6curite dans le domaine de 
Sexploitation de systemes informatiques. En effet pour des raisons de s6curite 
informatique certains systemes d'information utilises pour la gestion d'un ensemble de 
bases de donnees incorporent dans leur ensemble de logiciels d'exploitation un 

30 dispositif de verrouillage de la remise en service d'une base de donnees reorganisee 
avant la prise de la copie de sauvegarde correspondante. 

Selon un premier mode d'execution de la methode de gestion selon I'invention 
I'ordre optimal des reorganisations est coordonne avec I'ordre des copies de 
sauvegarde d'objets du systeme d'information en tenant compte des reorganisations en 

35 cours ou juste effectuees. Selon une variante avantageuse I'ordre des copies de 
sauvegarde est modifie par l'ex6cution en premiere priorite, pour au moins un objet 3 
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reorganiser OR, de la copie dudit objet OR au plus t6t en fin de traitement de 
reorganisation. 

Pour ce faire, la methode de gestion des reorganisations selon I'invention est 
globalisee pour g§rer d'une part les reorganisations, d'autre part les copies sachant 
5 que pour des raisons d'optimisation on a la faculty de decouper les objets a traiter en 
partitions jusqu'aux plus petites parties d'objets a traiter possibles pour chaque type 
de traitement. il en r6sulte que la liste et les objets a copier peuvent etre differents de 
la liste et des objets d reorganises 

Par ailleurs en ce qui concerne les copies, on distingue g6neralement trois 
10 types de copie, la copie en continu ou copie « journal » (en anglais «log»), la copie 
incremental qui ne prend que les modifications apportees aux fichiers et la copie 
totale ou copie image. Dans le cadre de la presente invention, sont concernees 
principalement les copies images et accessoirement les copies incrementales. 

D'une fa?on silimaire £ ce qui a ete mis en place pour les reorganisations, la 
15 methode de gestion des reorganisations et des copies comporte une phase de creation 
et de maintien d'une liste PRIOCOPIE de priorite des objets d copier (en fonction du 
temps passe depuis la derntfcre copie de chaque objet & copier OC) et retablissement 
d'un planning rapide de copie, sachant que certains objets OR juste reorganises (par 
exemple une base de donnees) sont d6verrouill6s avant remise en ligne par une prise 
20 de copie image; pour ce faire, on choisit dans le cadre de la pr6sente invention de 
copier ces objets en premiere priorite. II en r6sulte une double interaction entre le 
planning rapide de copie PPC et le planning rapide de reorganisation PRR* (voisin du 
planning PRR mais modifie en consequence pour integrer la composante copie), pour 
le premier, PPC, par la priorite premiere donnee 3 certaines ou £ toutes les copies 
25 apres reorganisations et pour le second, PRR*, par I'allongement du temps total de 
reorganisation par addition au temps machine r6el de reorganisation d'un temps 
d'attente (aussi appeie temps gaspiiie) correspondant au temps de copie de I'objet 
juste reorganise. 

A cette fin, I'invention propose une methode globale de gestion des reorganisations 
30 d'un ensemble de bases de donnees indexees d'un systeme informatique d'information 
adaptee a la reorganisation « hors ligne » integrant la gestion des copies et comportant 
les phases operationnelles suivantes (voir figure 2) : 
(40) - Creation et maintien par mise d jour en continu : 

• d'une liste PRIOREORG des objets £ reorganiser par priorite decroissante 
35 fonction de retat de desorganisation des objets d reorganiser ; et 

• d'une liste PRIOCOPIE des objets d copier par priorite decroissante fonction de 
I'anciennete des dernieres copies des objets a copier. 



WO 03/085554 _ PCT/FR03/01076 



(50)- Surveillance en continu de I'apparition dans le systeme d' information de tout 
6v6nement : 

- RAZR=1 pour lequel la selection du premier ou prochain objet £ r6organiser POR 
doit §tre remise en cause, notamment une fin d'une tache de reorganisation dans 

5 une region de traitement de reorganisation et/ou la liberation d'une zone de 

traitement pour la reorganisation ou la copie ; et/ou 

- RAZC=1 pour lequel la selection du premier ou prochain objet k copier POC doit 
etre remise en cause, notamment une fin d'une tache de copie dans une region de 
traitement de copie, une copie prioritaire en fin de reorganisation et/ou la 

10 liberation d'une zone de traitement pour la reorganisation ou la copie, 

avec pour tout 6v6nement RAZR=1, lancement de ('execution du processus IDPOR 
d' identification du premier objet £ reorganiser POR ou, si le processus IDPOR est en 
cours d'execution, interruption et nouveau lancement du processus IDPOR ; et/ou 
pour tout 6venement RAZC=1, lancement de l'ex6cution du processus IDPOC 

15 d' identification du premier objet £ copier POC ou, si le processus IDPOC est en cours 
d'execution, interruption et nouveau lancement du processus IDPOC ; 
• le processus IDPOR comportant les operations suivantes 

(51) - Etablissement d'un planning rapide de reorganisation PRR* a I'aide de la 
iiste PRIOREORG et du temps operationnel de reorganisation residuel disponible TRR 

20 dans I'ensemble des regions de reorganisation et d'une Iiste de selection SELECT/OR 
d'objets & reorganiser OR ordonnes par priorites decroissantes optimisees en fonction 
du gain de la reorganisation de chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur representatif du taux de d6sorganisation d'un objet OR par le 
temps de reorganisation de cet objet; 

25 (52) - Etablissement d'un planning rapide de copie PRC 3 partir de la Iiste 

SELECT/OR, puis de la Iiste PRIOCOPIE et dans la limite du temps operationnel de 
copie residue! disponible TRC dans I'ensemble des regions de copie, d'une Iiste de 
selection SELECT/OC en m6moire de type LIFO ou pile d'objets a copier OC empiies 
par priorites decroissantes; 

30 (53) ■ Etablissement d'un retroplanning de copie dans lequel pour tout objet 

courant £ reorganiser OR extrait de la Iiste SELECT/OR par priorite croissante, on 
calcule pour chaque region de copie le temps d reserver TCR pour la copie de I'objet 
OR apres reorganisation ; 

(54) - Etablissement d'un retroplanning de reorganisation dans lequel pour tout 

35 objet courant a reorganiser OR extrait de la Iiste SELECT/OR par priorite croissante 
pour favoriser le traitement avance des objets de plus grandes tailles possibles, on 
calcule pour chaque region de reorganisation le dernier d6lai de la region DDR, 
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repr6sentant dans la fenStre « batch » allou§e a la reorganisation « hors ligne » le delai 
minimal necessaire a la reorganisation de I'objet courant OR, selon une formulation 
distincte si une copie de I'objet OR en fin de reorganisation doit etre faite ou non; 

(55) - Identification de la region de traitement RTR de I'objet courant a r6organiser 
5 OR par adequation optimisee entre la duree de traitement disponible dans ladite 

region DRR avec la dur6e de traitement DROR necessaire pour la reorganisation de 
I'objet courant OR avec DRR - DDL minimal <0 sans copie a faire ou avec valeur 
absolue de DRR - DDL minimal et DROR+DCOR < DRR si copie a faire; 

(56) - Inscription de I'objet courant a reorganiser OR comme prochain objet a 
10 reorganiser POR au planning de la region identifi6e en valorisant le pointeur POR 

correspondent a I'adresse de I'objet courant OR, en augmentant la duree de temps 
consomme DCRR dans la region du temps de la reorganisation DROR et recalculant la 
duree gaspiliee dans la region de reorganisation DGRR du fait des copies d'objets OR 
en fin de reorganisation. 
15 (60> Lancement, en I'absence de tout evfcnement de remise a zero RAZR=1 survenu 
entre temps, dds qu'une region de traitement de reorganisation RTR identifiee est 
disponible, de la reorganisation de I'objet POR ; Remise a zero et nouvelle execution 
du processus IDPOR ; et, le processus IDPOC comportant les operations suivantes 



(51) - Etablissement d'un planning rapide de reorganisation PRR* a I'aide de la 



20 liste PRIOREORG et du temps operationnel de reorganisation residuel disponible TRR 
et d'une liste de selection SELECT/OR d'objets a reorganiser OR ordonnes par 
priorites decroissantes optimisees en fonction du gain de la reorganisation de chaque 
objet OR, ledit gain etant defini comme le produit d'un facteur representatif du taux de 
desorganisation d'un objet OR par le temps de reorganisation de cet objet; 

25 (52) - Etablissement d'un planning rapide de copie PRC a partir de la liste 

SELECT/OR, puis de la liste PRIOCOPIE et dans la limite du temps operationnel de 
copie residuel disponible TRC, d'une liste de selection SELECT/OC en memoire de 
type LIFO ou pile d'objets OC empiies par priorites decroissantes; 



(53') ■ Etablissement d'un retroplanning de copie avec determination des dur6es 



30 de copie disponibles en region copie, depilage de la liste SELECT/OC de haut en bas 
et recherche d'une region copie par adequation entre la dur6e copie disponible et la 
dur6e copie de I'objet courant a copier OC de fa?on a copier les objets les plus grands 
possibles et marquage de I'origine de reorganisation ou non de I'objet a copier ; suivi de 
- ('identification de la region de traitement RTC de I'objet a copier par adequation entre 

35 la duree de traitement disponible dans ladite region avec la duree de traitement 
necessaire pour la copie de I'objet courant OC; suivie de 
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- I'inscription de I'objet courant OC comme le prochain objet a copier POC au planning 
de la region RTC identifiee en valorisant le pointeur POC correspondant d I'adresse de 
I'objet OC et en diminuant la dur6e de traitement disponible du temps de la copie de 
I'objet OC retenu comme POC ; 
5 (60')- Lancement, en I'absence de tout evdnement de remise £ zero RAZC=1 survenu 
entre temps, d£s qu'une region de traitement de copie TRC identifiee est disponible, de 
la copie de I'objet POC; Remise a z6ro et nouvelle execution du processus IDPOC. 
Bien entendu sans sortir du cadre de 1'invention, it existe dans des variantes de la 
methode de invention certains cas d'objets a reorganiser OR pour lesquels la copie 

10 juste apres reorganisation n'est pas necessaire. Dans ces cas et pour ces objets 
particuliers les phases op6rationnelles ci-dessus sont modifies en consequence. 
En particulier dans une recherche continuelle d'optimisation, la methode gestion selon 
1'invention dans une de ses variantes intfcgre dans les phases finales de processus 
IDPOR d'un objet OR une phase de recherche d'un ou plusieurs objets £ reorganiser 

15 OR sans copie OR dans la liste SELECT/OR ou a defaut dans la liste PRIOREORG 
susceptibles d'etre reorganises dans la region de traitement RTR correspondante 
pendant I'intervalle du temps d'attente de la copie de I'objet OR apr£s reorganisation. 
Avantageusement la phase (51) d'Etablissement d'un planning rapide de 
reorganisation PRR* comporte les operations suivantes (voir figure 3) : 

20 (511) - Initialisation : dans laquelle sont notamment annuies les indicateurs de 
selection des objets OR, initialise le compteur-limiteur de remises en causes, les 
temps residuels de copie TRC et de reorganisation TRR et la duree minimale E de 
reorganisation et copie d'un objet OR ; 

(512) • Boucle sur objets : dans laquelle notamment pour tout objet reel OR de la liste 
25 PRIOREORG pris dans I'ordre decroissant jusqu'3 ce que TRR < E, une marque de 

'selection possible' de I'objet est posee; 

(513) - Elimination des intersections d'objets : dans laquelle notamment sont eiimines 
de la 'selection possible' les objets reels OR parties d'espaces de tables egalement 
appeies objets globaux dejS selectionn6s en tout ou partie; 

30 (514) • Remise en cause des choix precedents : dans laquelle notamment sont eiimines 
de la 'selection possible' les objets OR dont le temps total de reorganisation et 
copie est sup6rieur au temps de reorganisation r6siduel TTR et & d6faut dans 
laquelle I'objet courant OR et les objets OR deja seiectionnes dans la liste 
SELECT/OR sont soumis d un processus d'optimisation en fonction du gain de 

35 reorganisation avec replacement d'un objet deja seiectionne par I'objet en cours 

avec essais, dans la limite du terme du compteur-limiteur, de combinaisons 
successives tendant 3 retenir pour etre seiectionne au final dans SELECT/OR des 
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objets de plus grand gain de reorganisation possible et i les associer aux autres 
objets OR de la 'selection possible' de fagon £ ce que le temps total des 
reorganisations de tous les objets OR retenus soit inferieur mais le plus proche 
possible du temps r6siduel de reorganisation TRR. 
5 (515) • Verification de la suffisance du temps copie disponible dans le temps residue! 

de copie TRC pour chaque objet OR en passe d'etre finalement s6lectionn6 pour la 
reorganisation compte tenu de la priorite de reorganisation de I'objet OR par 
rapport aux objets d copier en pr6alable du fait de leurs priorites copie 
superieures. 

10 (516) - Selection de I'objet courant dans la liste SELECT/OR: dans laquelle 
notamment sont positionnes les indicateurs de I'objet courant et de Pobjet global 
associe, annuies 6ventuellement les indicateurs du ou des objets OR 
d6s6lectionnes e t diminuer TRR et TRC des temps respectifs de reorganisation et 
de copie. 

15 Encore avantageusement, ladite phase (52) d'etablissement d'un planning 

rapide de copie PRC comporte les operations suivantes (voir figure 4) : 

(521) • Initialisation : au sortir d'un planning de reorganisation PRR* et dans laquelle 
sont notamment videes les piles de selection de copie PSC1 et PSC2, initialises le 
compteur-Hmiteur de remises en causes, le temps r6siduel de copie TRC et la dur6e 

20 minimale EC de copie d'un objet £ copier OC ; 

(522) - Inspection des regions de reorganisation : Pour toutes les regions, 

si region active, et si image copie de I'objet en cours de reorganisation 3 fa ire et/ou si 
image copie de tout objet OR de la liste SELECT/OR pris dans I'ordre des priorites 
d6croissantes d faire: pour tout sous-objet susceptible d'etre copie s6parement, 
25 notamment une partition, soustraction du temps de copie du sous-objet de TRC et 
placement du sous-objet en haut de la premiere pile PSC1 ; 

(523) - traitement de la liste des objets 3 copier PRIOCOPIE : dans laquelle 
notamment pour tout objet £ copier OC de la liste PRIOCOPIE pris dans I'ordre 
d6croissant jusqu'S ce que TRC < EC et absent de PSC1, soustraction du temps de 

30 copie du sous-objet OC de TRC et placement du sous-objet OC en haut de la seconde 
pile PSC2 , 

(524) - Empilage des piles de selection : dans laquelle la pile PSC1 est superpos6e d la 
pile PSC2 pour constituer la liste SELECT/OC. 

Encore avantageusement,- ladite phase (53) d'etablissement d'un 
35 retroplanning de copie dans le processus IDPOR comporte les operations suivantes : 
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(531) Initialisation des regions de copie : dans laquelle au sortir d'un planning de 
reorganisation pour toutes les regions de copie, la duree consommee de la region 
DCRC est mise d zero, 

(532) Determination du temps de copie a reserver TCR : dans laquelle pour tout objet 
5 reel de la liste SELECT/OR parcourue dans I'ordre des priorites croissantes et pris 

comme objet a reorganiser courant OR, 

-le temps & r6server pour copier TCR I'objet reel courant OR est mis S zero ; 

-Si I'image copie de tout objet OR de la liste SELECT/OR pris dans I'ordre des priorites 

croissantes doit 6tre faite: pour tout sous-objet susceptible d'etre copie s6parement, 

10 notamment partition, on recherche une region copie dont la duree consomm6e DCRC 
est minimale, on ajoute le temps de copie du sous-objet & la duree consomm6e de la 
region courante DCRC et on valorise le temps £ reserver TCR pour copie de I'objet 
courant = maximum (du temps £ r6server TCR pour copie de I'objet courant et de la 
duree consommee dans la region DCRC). 

15 Encore avantageusement, la phase de retroplanning de reorganisation (54) 

dans le processus IDPOR comporte les operations suivantes : 

(541) - Initialisation : dans laquelle pour toute region de reorganisation, 

- Duree de la region DRR = Dur6e de la fenetre 'batch' DFB moins I'heure relative 
estimee de fin du traitement de reorganisation en cours dans la region HRFR 

20 - Duree consommee dans la region DCRR = 0 

- Duree gaspiliee dans la region DGRR = 0 

- Pointeur premier objet a reorganiser de la region courante = 0 

(542) - Determination du dernier deiai de la region de reorganisation DDRR : dans 
laquelle pour tout objet reel OR seiectionne de la liste SELECT/OR dans I'ordre des 

25 priorites croissantes : 

Pour chaque region si I'image copie de I'objet courant OR a faire, calcul du 

dernier deiai de la region DDRR = duree de reorganisation de I'objet courant DROR + 

max [temps d reserver pour copie de I'objet courant TCR, (duree consommee de la 

region DCRR + duree gaspiliee de la region DGRR)] ; 
30 • Sinon, calcul du dernier deiai de la region DDR = duree consommee de la region 

DCRR + max [(duree de reorganisation de I'objet courant DROR, duree gaspiliee de la 

region DGRR)]. 



reorganisation RTR (55) comporte les operations suivantes : Selon le type d'objet 
35 courant a reorganiser OR 

(551)- Recherche de la region de traitement de reorganisation susceptible d'accueillir 
de fa?on optimale un objet a reorganiser OR sans copie : comportant 



Encore avantageusement la phase d' identification de la region de 
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- la recherche d'une region dont le dernier detai DDRR est minimal, et si dernier deiai 
de la region courante DDR est superieur d la dur6e de la region courante DRR, la 
recherche d'une region pour laquelle : [duree de la region courante DRR moins le 
dernier deiai de la region courante DDRR] est minimale et positive ou nulle ; sinon 

5 (552)- Recherche de la region de reorganisation susceptible d'accueillir de fagon 
optimale un objet £ r6organiser OR avec copie : comportant 

- la recherche d'une region telle que : [duree de la region DRR moins dernier deiai de 
la region courante DDRR] est minimale en valeur absolue, et [duree de reorganisation 
DROR + temps de copie objet courant TCR] < duree de la region DRR. 

10 Encore avantageusement la phase description de I'objet OR au planning de 

la r6gion de reorganisation RTR (56) comporte les operations suivantes : 

(561) - Inscription de I'objet courant OR comme prochain objet 3 r£organiser POR: 
dans laquelle si image copie de I'objet courant OR d faire ou duree gaspiliee de la 
region courante = 0 f on valorise le pointeur premier objet a r£organiser POR de la 

15 region courante = adresse de I'objet courant, 

(562) • mise £ jour DCRR et DGRR : dans laquelle on ajoute la duree de reorganisation 
de Tobjet courant DROC a la duree consommee de la region courante DCRR, et on 
valorise la duree gaspiliee de la region courante DGRR = dernier d6lai de la r6gion 
courante DDRR - duree consommee de la region courante DCRR. 

20 Toujours avantageusement la phase (53') d'etablissement d'un retroplanning 

de copie dans le processus IDPOC comporte les operations suivantes: 
(531') Initialisation des regions de copie : dans laquelle pour toutes les regions, 
*la dur6e de region DRCOP est valorisee 3 la duree fenetre « batch » DFB moins I'heure 
relative estimee de fin de traitement copie en cours HRFC, 

25 -la duree consommee de la region DCRCOP est mise £ z6ro, 

le pointeur du premier objet & copier POC de la region courante est mis d zero 
(532') Depilage et identification du prochain objet £ copier POC : Dans la laquelle, 
•Pour tout objet de la pile PSC1/PSC2 parcourue de haut en bas un objet courant a 
copier OC est extrait lorsque le temps de copie de I'objet courant TCOC < DRCOP la 

30 plus longue ; 

•On cherche pour identifier la region de traitement copie une region dont la dur6e 
consommee DCRC est minimale ; dans Taffirmative si le temps de copie de I'objet 
courant TCOC > DRCOP - DCRCOP on cherche une region pour laquelle DRCOP - 

DCRCOP -TCOC minimale, positive ou nulle, 
35 Si aucune region ne convient, on choisit une region & copier pour laquelle DRCOP - 

DCRCOP - TCOC est negative et minimale en valeur absolue et pour laquelle TCOC < 
DRCOP ; 
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•Si I'objet courant appartient a la seconde pile PSC2, soit un objet a copier non issu 
d'une reorganisation, le pointeur de I'objet POC pour la region courante choisie est 
valorise a I'adresse de I'objet courant OC de fa?on a inscrire I'objet POC au planning 
de la region de traitement copie RTC identifiee ; et 
5 -Pour terminer, on ajoute la dur6e copie TCOC d la dur£e consomm6e de la region 
courante DCRCOP. 

Selon les diverses variantes de mise en oeuvre de la methodes de gestion de 
reorganisations « hors ligne » dans des regions de traitement il est possible de choisir 
les evenements internes au systeme remettant en cause la selection des objets POR ou 

10 POC les plus appropries aux processus de selection utilises. 

En particulier les evenements internes au systeme RAZR=1 et RARC=1 
entratnant la remise en cause de la selection des objets POR ou POC sont notamment 
constitues respectivement par la fin d'une tSche de reorganisation dans une region de 
traitement de reorganisation pour les objets POR ou par la fin d'une tSche de copie 

15 dans une region de traitement de copie pour les objets POC, une copie prioritaire en 
fin de reorganisation et/ou la liberation d'une zone de traitement pour les objets POR 
et POC. 

Paralieiement ou non £ la mise en ceuvre la methode adaptee aux reorganisations 
« hors ligne », 1'invention propose une methode de gestion des reorganisations dans un 
20 ensemble de bases de donnees indexees d'un systeme d'information adaptee d la 
reorganisation « en ligne » et caracterisee en ce qu'elle comporte au moins les phases 
operationnelles suivantes: 

• une phase d'analyse instantanee d'au moins un objet d reorganiser OR parmi les 
objets susceptibles de reorganisation, notamment bases de donnees, partitions et/ou 

25 index, et d'estimation du surcout associe au niveau de d6sorganisation de I'objet & 
reorganiser OR; 

• une phase d'estimation instantanee du cout de la reorganisation en ligne en fonction 
de la taille dudit objet £ reorganiser OR et du taux de desorganisation dudit objet OR; et 

• une phase de determination du seuil Ds de desorganisation minimal de I'objet d 
30 reorganiser OR au dessus duquel seuil la reorganisation « en ligne » peut etre lancee 

pour cet objet OR et le, cas 6cheant, du lancement effectif de cette reorganisation en 
ligne, le seuil Ds correspondant sensiblement au minimum du cout total du surcout 
estime de la desorganisation de I'objet OR et du cout estime de la reorganisation pour 
I'objet OR consid6r6. 

35 Selon une premiere variante, la methode de gestion des reorganisations « on line » 

est caracterisee en ce que le lancement de la reorganisation «en ligne » est retarde 
pour attendre une fenetre temporelle d'activite reduite de la base de donnees 
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concernee. Selon une variante particuliere de I'invention la methode de gestion 
incorpore une phase de calcul de I'heure optimale de lancement d'une reorganisation 
«en ligne» (on line) en fonction de I'activite reelle ou prevue du systdme d'information 
correspondant. 

D'une fa$on plus globale les methodes des reorganisations « en iigne » et « hors 
ligne » sont combinSes de fa9on d ce que pour un objet OR s6lectionn6 comme 
prochain objet d r6organiser POR la priority est donnSe pour la reorganisation « hors 
ligne », V intervention de la reorganisation « en ligne » n'etant requise qu'aprfcs 
depassement du seuil Ds. II est ainsi possible de soulager la reorganisation « hors 
ligne » par des reorganisations «en ligne » lorsque ces derniSres ne sont pas trop 
penalisantes au niveau de la qualite des services en ligne. 

L'invention concerne egalement une methode de gestion des reorganisations « en 
ligne » et « hors ligne » dans un ensemble de base de donnees indexees caracterisee en 
ce que pour un m§me objet POR la priorite est donnee pour la reorganisation « hors 
ligne », Intervention de la reorganisation « en ligne » n'etant requise qu'apr£s 
depassement du seuil Ds pour I'objet POR considere. 

Selon une premiere version de la methode de gestion des reorganisations « on 
line » utilisee pour la reorganisation des bases de donnees index6es de type espace de 
tables, la methode est caracterisee en ce que pour un objet & r6organiser OR, le seuil 
Ds est defini par une approximation donn6e par la formule F5' suivante: 
R = Ds 2 r Co* / 2.I.C = 1 

lorsque que U, moyenne horaire du nombre de mises d jour sur I'objet OR, est faible, 
et dans laquelle : 

r designe le nombre moyen de lignes ou cie-RID par page de I'objet entier, 

I designe le nombre d'insertions de lignes (ou de cie-RID pour les index) £ I'heure dans 

I'objet OR, 

Co* d6signe le surcout horaire lorsque I'objet est totalement desorganis6 

c designe un param6tre machine, le rapport du temps d'accds E/S par la taille de 

I'objet Nbp. 

Selon une variante de la methode de gestion des reorganisations « on line» 
pr6cedente et utilisee pour la reorganisation des index, le seuil Dsl est defini pour un 
index par une approximation donnee par la formule F7' suivante : 
R= Dsl 2 r (t*+l)Nbp.V / [2(V+3)] = 1 

lorsque que U, moyenne horaire du nombre de mises & jour sur I'index, est faible, et 
dans laquelle : 

Ts designe le temps de deplacement de bras, Tl le temps de latence (1/2 tour du 
bras). 
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c = (Ts+ 3.TI)/Nbp ou Ts en E/S designe le temps de deplacement du bras du disque, 
et Tl le temps de latence (1/2 tour du bras) et V = Ts/TI. 

t* designe le taux de relecture de I'objet, c'est d dire le nombre moyen de fois qu'une 
entree sera relue. 

5 Selon une autre variante de la methode de gestion des reorganisations « en 

ligne » pr6cedente et utilisSe pour la reorganisation des bases de donn6es indexees de 
type espace de tables monotable a n index, caracterise en ce que le seuil DsT est defini 
pour un espace monotable par une approximation donnee par la formule F13' 
suivante : 

10 R = r.Nbp[DsT 2 .L (V+l) + V.SCDsT^bi 2 ) (t*i+l)/(2V+6) = 1 

lorsque que U, moyenne horaire du nombre de mises d jour sur I'espace monotable, 
est faible, et dans laquelle : 

L designe la proportion de lignes acced6es par parcours sequentiel sur le nombre de 
lignes cr66es, 

15 S represente le signe mathematique Sigma (somme des expressions f(xi) pour i index 
allant de 1 d n), 

bi represented !es valeurs instantanees de D (taux de disorganisation de I'espace 
monotable) lors des demidres reorganisations des n index, et 
t*i represented les taux d'accfcs directs au travers de chaque index i. 
20 L'invention concerne egalement I'application de la methode de gestion des 

reorganisations dans un ensemble de bases de donnees indexees d'un systeme 
informatique d'information presentee ci-dessus dans toutes ses variantes £ la 
reorganisation des bases de donnees indexees de type espace de tables defini dans la 
description ci aprds. 

25 L'invention concerne egalement les systemes informatiques de type systemes 

d'information comportant un ensemble de bases de donnees indexees et les moyens 
adaptes pour la mise en ceuvre de la methode de gestion des reorganisations 
presentee ci-avant, de base de donnees indexees, notamment de bases de donnees de 
type espace de tables et/ou d' index. 

30 D'autres caracteristiques et avantages de la methode de gestion globale des 

reorganisations de bases de donn6es indexees et de ses applications a la 
reorganisation des bases de donnees indexees notamment du type espace de tables 
selon la presente invention apparattront d la lecture de la description qui va suivre en 
reference aux dessins ci-joints d'un mode de mise en ceuvre preferentiel de l'invention 

35 et presente £ titre d'exemple non limitatif. 

PRESENTATION SOMMAIRE DES DESSINS 
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ia figure 1 represente un organigramme correspondant & la methode de gestion 
des reorganisations d'un ensemble de bases de donn6es indexees, notamment de 
type espace de tables, selon Tinvention; 

la figure 2 represente un organigramme correspondant 3 la methode de gestion 
des reorganisations et des copies d'un ensemble de bases de donn6es index6es, 
notamment de type espace de tables, selon Tinvention; 

ta figure 3 represente un organigramme detaillant les operations de la phase 
d'6tablissement d'un planning rapide de reorganisation de la methode de la figure 

2; 

la figure 4 represente un organigramme detaillant les operations de la phase 
d'etablissement d'un planning rapide de copie de la methode de la figure 2 ; 
la figure 5A represente un organigramme correspondant d une methode de lecture 
d'une base de donnees indexee, notamment en vue de la reorganisation de la base 
de donnees, utilisable dans le cadre de Tinvention; 

la figure 5B represente un organigramme correspondant £ une methode de lecture 
de Tindex de la base de donnees indexee, notamment en vue de la reorganisation 
de Tindex, utilisable dans le cadre de Tinvention; 

la figure 6A represente un organigramme correspondant a une variante partielle 
de la methode de la figure 5A appliquee a la lecture et au dechargement de Tindex 
d'une base de donnees indexee de type espace de tables, notamment en vue de la 
reorganisation de la base de donnees indexee, utilisable dans le cadre de 
Tinvention; 

la figure 6B represente un organigramme correspondant a une variante partielle 
de la methode de la figure 5B appliqu6e a la lecture et au dechargement de Tindex 
d'une base de donnees indexee de type espace de tables, notamment en vue de la 
reorganisation de Tindex de la base de donnees indexee, utilisable dans le cadre 
de Tinvention; 

la figure 7 represente un organigramme correspondant £ une variante partielle de 
la methode appliqu6e S la lecture et au dechargement de la base de donnees 
indexee de type espace de tables objet de la figure 6A, utilisable dans le cadre de 
Tinvention; 

la figure 8A represente un organigramme correspondant une methode de 
reorganisation d'une base de donnees indexee de type espace de tables utilisant 
les methodes de lecture et de dechargement objet des figures 6A et 7, utilisable 
dans le cadre de Tinvention; et 

la figure 8B represente un organigramme correspondant une methode de 
reorganisation de Tindex de la base de donnees index6e de type espace de tables 
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objet de la figure 8A, methode utilisant la methode de lecture et de dechargement 

objet de la figure 6B, utilisable dans le cadre de Pinvention. 

La description de la methode de gestion globale de reorganisation d'un 
ensemble de bases de donnees indexSes qui va suivre, presentee d titre d'exemple non 
limitatif, se rapporte a une application particulidre de Pinvention aux bases de donnees 
index6es structures en espaces de tables ('tablespace* en anglais), susceptibles 
d'atteindre de trds grandes tailles (jusqu'3 quelques milliards de lignes) et pour 
lesquelles le maintien d'une bonne organisation, notamment par une reorganisation 
rapide et efficace, est capital du point de vue performances. 

Exemple de bases de donnees ind exes, les bases de donnees de type espace de table : 
Une base de donnee indexee structure en espace de tables est compos§e d'un ou 
plusieurs fichiers formes de blocs de taille unique ou pages numerotees en sequence 3 
partir de z6ro. Du point de vue logique on considere qu'il n'existe qu'un seul fichier 
compose de la succession de chacun des fichiers physiques numerotes 1, 2, etc... . 

Parmi ces pages on trouve les pages de contrdle et les pages de donnees adaptees 
pour contenir des lignes, chaque ligne etant identifiee de fa?on unique par son RID 
compose du num6ro de page et du numero d'ordre £ Pinterieur de la page. Chaque 
ligne est compos6e de champs de donnees appeiees colonnes. Une c!6 est une liste de 
colonnes ayant un ordre croissant ou decroissant. A chaque cie est associ6e un index. 

Un espace de tables peut contenir une ou plusieurs tables presentant chacune des 
colonnes specifiques. Toutefois les espaces de tables multi-tables peuvent §tre traites 
comme les espaces de tables mono-table £ condition de traiter les tables et leurs index 
en sequence. 

Les espace de tables peuvent etre partitionnes (divises en plusieurs parties ou 
partitions). Chaque partition etant alors identique au fichier physique portant son 
numero. 

A la creation de la base de donnees, il est prevu un espace libre de donn6es et un 
espace libre d'index constitues chacun de pages vides reparties dans I'espace de 
tables et dans Pindex; le but de cette repartition de pages vides entre certaines pages 
de donnees et index est de permettre des ajouts et autres mises & jour de lignes de 
donnees ou de cies d'index £ proximite des pages correspondantes et de limiter ainsi 
les d6sorganisations trop importantes. 

On considere qu'un espace de tables est bien organise lorsque: 

- Pespace libre de donnees (pages vides) est distribue dans I'espace de tables selon les 
parametres d'origine ; 

- les lignes sont rang6es par ordre de RID dans le meme ordre que la premiere cie dite 
cie 'primaire'. 
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L'index est compose comme I'espace de tables d'un ou plusieurs fichiers formes 
de pages. Les pages sont de plusieurs type, en particulier pages de contrfile, pages 
'feuilles' et pages de niveau superieur. Les pages feuilles contiennent des cies et pour 
chaque c!6 le ou les RID de la ou des lignes d'espace de tables dont la cl6 
5 correspondante a la meme valeur. Ainsi a chaque ligne d'espace de tables est associe 
un couple cie-RID de page feuille de l'index. 

Chaque page feuille contient un ensemble contigu de couples cie-RID, c'est d dire 
qu'il n'existe aucun couple exterieur a la page qui soit compris entre deux couples de 
la page. Les pages feuilles sont ainsi logiquement ordonn6es par I'un quelconque de 
10 leurs elements. 

En cas de partitions d'espace de tables, il en sera de m§me pour son index 
primaire, une partition d'index etant associee a chaque partition de I'espace de tables. 

On considdre qu'un index est bien organist lorsque: 
- I'espace libre est distribue dans I'espace de tables selon les parametres d'origine ; 
15 • les pages feuilles sont rangees par num§ros dans le meme ordre que les cl6s. 

La definition de base de donnees indexSe de type 'espace de tables' donnee ci- 
dessus restera valable pour la suite de I'expose. 

D'une fagon g6n6rale la reorganisation unitaire d'une base de donnees (et de son 
index) consiste a d6charger la base de donnees, & ranger ses lignes d'information dans 
20 un ordre souhaite, par exemple I'ordre alphabetique, puis d recharger les lignes une 
fois rangees dans la base de donnees en mettant a jour les index, si possible de fa?on 
r£organisee. 

Exem ple de reorganisation « hors-ligne » de bases de donn6es indexSes. 
notamment de type espace de tables : 

25 Toujours & titre d'exemple non limitatif, on utilise pour la reorganisation unitaire 

des bases de donnees index6es structur6e en lignes et notamment les bases de type 
espace de tables un mode de lecture (dechargement) et un mode de reorganisation 
permettant de reduire sensiblement le temps necessaire £ la lecture ordonnee de la 
base de donn6es indexee (lecture et eventuelle mise en ordre continue ou discontinue) 

30 et/ou d la reorganisation de la base de donnees indexee. 

En particulier on utilise de fagon generate comme methode de lecture de bases de 
donnees indexee dans laquelle les donnees apparaissent sous forme de lignes de 
donnees, la methode LEC/BD/REORG/BD: comportant les operations suivantes (voir 
figure 5A): 

35 [101] - Lecture simultanee et s6quentielle de l'index et de lignes de la base de 
donnees, BDD, avec le chargement des index dans une premiere memoire tampon MX 
et le chargement des lignes dans une seconde memoire tampon MT, 
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[102] • Lecture des index de la m£moire tampon MX vers memoire tampon MT de 
fa?on ordonn6e, 

[103] ■ Recherche dans la m§moire MT de la presence d'une ligne dont IMdentifiant est 
donn§ par la lecture ordonn§e de I'index, 
5 [103A] - Dans I'affirmative, extraction de la ligne vers un fichier de lignes ordonnSes 
logiquement FT1, 

[103B] ■ Dans la negative, vidange partielle de la memoire tampon vers un fichier FT2 
de lignes £ trier avec elimination de la memoire tampon MT d'au moins la page dont le 
num6ro est le plus faible, 

10 [104] - Poursuite de la lecture jusqu'a la fin de la base de donn6es, les lignes restantes 
n'ayant pu etre extraites de fagon ordonn6e 6tant dirigees vers le fichier FT2. 

Appliquee £ la reorganisation de la base de donn6es, la methode de lecture 
LEC/BD/REORG/BD permet, aprds le tri du fichier FT2 pour donner FT2, de combiner 
les deux fichiers ordonnSs FT1 et FT2 en un fichier virtuel FTV servant d'entr6e d la 

15 phase de rechargement de la reorganisation de la base de donnees. 

II est d noter que par fichier virtuel on entend un fichier qui n'a pas d'existence 
rgelle, car ce fichier est le produit theorique de la fusion virtuelle de deux de fichiers, 
mais qui peut §tre utilise au rechargement comme un fichier r6el dans la mesure ou le 
programme de rechargement lit £ la fois sur le fichier FT1 et a la sortie FP2 du tri 

20 (elle-meme un fichier virtuel g6n6ralement nomme « exit de tri ») et opSre la fusion 
ligne 3 ligne au lieu de lire un seul fichier. L'expression fichier virtuel designe plus 
g6n§ralement une entity sur laquelle on peut operer les memes fonctions que sur un 
fichier sequentiel classique (ouverture, lecture ou 6criture d'un enregistrement, 
fermeture) et qui du point de vue de ces fonctions se comporte exactement comme un 

25 fichier sequentiel classique. 

Ainsi grace d la generation, en continu et par simple extraction, d'un fichier 
intermediate de lignes ordonnees logiquement FT1 pendant 1'operation de lecture 
sequentielle, le nombre de lignes d trier pr6sentes en en fin de parcours dans le fichier 
FT2 est r§duit de fa?on substantielle d'ou un gain de temps sensible tant pour 

30 1'operation de lecture de la base de donnees que pour le traitement complet de la 
reorganisation de la base de donnees. 

La methode de lecture de bases de donnees LEC/BD/REORG/BD permet a partir 
d'une lecture de type sequentielle de la base de donnees d'obtenir un fichier virtuel 
ordonne des lignes de donnees tout en minimisant Tetape de tri effectu6e sur un fichier 

35 intermediate partieL 

De fa?on analogue on utilise comme methode de lecture d'index de bases de 
donnees index6e dans laquelle les donnees apparatssent sous forme de lignes de 
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donn6es, la methode LEC/IND/REORG/IND comportant les operations suivantes (voir 
figure 5B): 

[101X] - Lecture sequentielle de I'index avec le chargement des index dans une 
memoire tampon MX, 

5 [102X] -Verification de la position du couple cie/ligne de plus bas numSro d'ordre 
(cl6/ligne INF) present dans memoire tampon MX par rapport a la position du dernier 
couple trait6 f en particulier si le numSro d'ordre du couple cie/ligne INF est sup6rieur 
au numSro d'ordre du dernier couple traits 

[103XA] - Dans Taffirmative, extraction du couple cie/ligne INF vers un fichier de 
10 couples d'index logiquement ordonnSs FX1, 

[103XB] - Dans la negative, vidange partielle de la memoire tampon NIX vers un fichier 
FX2 de couples d trier avec elimination de la memoire tampon MT d'au moins le 
couple cie/ligne dont le num6ro est le plus faible, 

[104X] • Poursuite de la lecture jusqu'S la fin de la base de donnees, les couples 
15 cie/ligne restant n'ayant pu etre extraits de fa?on ordonnee etant dirig6s vers le fichier 
FX2. 

Ainsi I'operation de lecture ordonnee de I'index, continue ou discontinue en 
I'absence de certaines valeurs de cie d'index, permet I'extraction directe d'un fichier 
d'index logiquement ordonne FX1 et d'un fichier d'index a trier FX2. Apr£s le tri du 
20 fichier FX2 pour donner FX'2, les deux fichiers ordonn6s FX1 et FX'2 sont fusionnes en 
un fichier virtuel FXV servant d'entr6e a la phase de rechargement de la reorganisation 
de I'index. 

Dans la pratique on arrive a constituer des fichiers FT1 contenant plus de 90% des 

lignes lues. D'autre part la dur6e d'un tri est plus que proportionnelle d la quantite 
25 d'information en entree, elle se trouve divisee par au moins 10. En ce qui concerne le 

temps de lecture, celui-ci reste bref car I'operation de lecture est realisee de fa?on 

sequentielle et simultanee sur la base de donn6es et sur I'index. 

Selon un premier mode de mise en oeuvre de la methode de lecture 

LEC/BD/REORG/BD et applicable a une base de donnees indexee de type 'espace de 
30 tables', le processus de lecture et de dechargement de I'index 3 I'aide la memoire 

tampon MX est realise par la methode LEC/IND/REORG/TABLE comportant les 

operations suivantes (voir: figure 6A) : 

[201]-Autant de fois que necessaire jusqu'a avoir atteint la fin de I'index et vide la 
memoire tampon MX, lecture sequentielle des pages de I'index en ne conservant que 
35 les pages d'index contenant au moins une cie, jusqu'S remplir la memoire tampon ou 
atteindre la fin de I'index ; cette lecture se faisant dans les emplacements non utilises 
de la memoire tampon ou contenant une page marquee invalide; 
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[202]- Recherche et remplacement des pages invalides dans la memoire tampon de 
1'index i partir de la premiere page de la m<§moire tampon MX, 
[206A] • Verification dans chaque page courante de la memoire tampon : 
- de Tabsence d'au moins un couple cie-RID sup6rieur au dernier couple cie-RID traite 
5 en sequence logique (ecrit dans le fichier index trie FX1 ou envoys en lecture d'espace 
de tables/base de donnees); ou 

• de I'exactitude de I'expression PXC < PXL- DMA ou PXC reprSsente le numero dans 
1'index de la page courante de la memoire tampon MX, PXL le numero dans I'index de 
la derniere page d'index lue et DMA la difference maximale autorisee entre pages 
10 d'index en cours de lecture; 

[206B] - Dans I'affirmative d'au moins une des deux propositions, invalidation de la 
page courante PXC et retour £ I'operation [201] pour lecture d'une nouvelle page 
index en sequence; 

[203] - Recherche de la page valide PXmin de la memoire tampon MX qui contient la 
15 cie la plus basse CLE INF de toute la memoire ou en cas d'egalite de cl6, le RID 
correspondant le plus bas; 

[204] - Traitement de la page PXmin en sequence logique comportant les operations 
suivantes : 

[208A]- Le cas echeant, lecture par ordre croissant de chacun des couples cie-RID de 
20 cette page PXmin; 

[208B] ■ Envoi de chacun des RID de cette page PXmin dans I'ordre croissant des 
couples cie-RID vers le traitement de lecture de la base de donnees de type espace de 
tables; 

[204C] • Invalidation de la page PXmin traitee et retour £ I'operation [201] pour 
25 lecture d'une nouvelle page index en sequence. 

On notera que I'operation 208B constitue un dechargement simplifie d'index, dans 
lequel seuls les RID des pages extraites en sequences logiques sont transmis et utilises 
pour la reorganisation de I'espace de tables. 

En particulier la methode de lecture et de dechargement 
30 LEC/TABLE/REORG/TABLE de I'espace de tables 3 I'aide la memoire tampon MT est 
realisee par les operations suivantes (voir figure 7): 

[301]- Autant de fois que necessaire jusqu'S avoir atteint la fin de I'espace de tables 
et vide la memoire tampon MT, lecture sequentielle des pages de I'espace de tables ou 
de la partition d partir du debut en ne conservant que les pages de donnees contenant 
35 au moins une ligne, jusqu'a remplir la m6moire tampon MT ou atteindre la fin de 
I'espace de tables; 
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[302] - Pour chaque RID present provenant de la lecture de I'index (voir operation 
208B): 

- si le RID d6signe un num6ro de page PTRID inf6rieur au minimum PTmin des 
num6ros de pages dans la mSmoire tampon MT, le RID est ignore parce que la page 

5 d6jS St§ traitee; retour au d6but de l'op6ration [302]; 

• si le RID dSsigne un numSro de page PTRID supSrieur au maximum des num6ros de 
pages PTmax dans la m6moire MT, la page n'a pas encore §t§ lue et on effectue [303]; 
si non on effectue [304] ; 

- si le RID est absent on effectue [305] ; 

10 [303] - Si PTRID - PTmax < INC, ou l'incr§ment autoris6 INC repr§sente le nombre 
maximal de pages de I'espace de tables qui peuvent etre lues pour retrouver un RID 
donnS, on effectue [303A] autant de fois que n§cessaire jusqu'a obtenir la page portant 
le num£ro de RID ; b d6faut on effectue [303B]; 

[303AJ- Vidange du contenu de la page de la m6moire MT ayant le plus petit num6ro 
15 de page PTmin en envoyant les lignes correspondantes dans le fichier tri-espace de 
tables FT2; lecture a I'emplacement de Pmin, de la page suivante d la page PTmax de 
la mSmoire tampon MT et on recommence jusqu'd obtenir une page de donnSes 
contenant au moins une ligne; lorsque la dernidre page introduite dans la m6moire MT 
porte bien le num6ro de RID, on effectue I'opSration [304]; 
20 [303B]- Si PTRID - PTmax > INC, et 

si PTRID(n) - PTRID(n-l) < PRM, ou le 'paramdtre de proximity PRM repr6sente 
l'6cart maximal des num§ros de pages de donn6es que deux RID consScutifs provenant 
de la lecture d'index ne devraient pas depasser, sauf en cas de trou dans la sequence, 
les deux pages PTRID(n) et PTRID(n-l) sont probablement voisines et on double la 
25 valeur de PincrSment autoris6 INC, & dSfaut INC reste inchangS; dans les deux cas on 
ignore le RID avec un retour £ Top6ration [302] ; 

[304]- Si le RID dSsigne une page PTRID pr6sente dans la m^moire tampon MT (y 
compris aprSs la lecture [303A]), il suffit pour cela que le numSro de page soit entre 
les bornes puisque que la m6moire tampon MT contient des pages non vides 
30 contigues, on 6crit la ligne correspondante sur le fichier des lignes ordonn6es FT1 et 
on divise ^increment autoris6 INC par 2, pour autant que le rSsultat ne soit pas en 
dessous de sa valeur minimale ; retour en [302] 

[305] - une fois traite tous les RID disponibles, on vide vers le fichier FT2 toutes les 
pages restantes de la m§moire tampon MT et Sventuellement toutes les pages de 
35 I'espace de tables encore non lues. 



22 



PCT/FR03/01076 



La methode de lecture et de dechargement ci-dessus UEC/TABLE/REORG/TABLE 
est appliquee de la fagon suivante pour la reorganisation des bases de donnees 
indexees de type espace de tables. 

En particulier on utilise comme methode de reorganisation unitaire d'une base de 
5 donnees index6e organis6e en espace de tables, la methode REORG/TABLE 
comportant les operations suivantes (voir figure 8A): 

[401] - Lecture sSquentielle et simultanee du contenu de Tindex et du contenu de 
T espace de tables et creation des fichiers de lignes de donnees FT1 et FT2; 
[402] -Si necessaire, tri du fichier FT2 par ordre de cle primaire croissante et 
10 eventuellement par ordre de table croissante s'il y a plusieurs tables; 
[403] - Fusion virtuelle des fichiers de lignes FT1 et FT'2; 

[404] - Rechargement du ou des fichiers contenant T espace de tables avec les lignes 

ainsi ordonnSes ou tribes en respectant les parametres d'espace libre ; 

[405] • Rechargement de Tindex primaire de chaque table dans le m£me ordre en 

15 prenant en compte le nouvel emplacement (RID) de chaque ligne; 

[406] - Mise a jour des autres index soit en modifiant les RID soit en les rechargeant 
apres tri des informations de c!6 et de RID. 

En ce qui concerne la reorganisation de Tindex ou d'une partition d'index de la 
base de donn6es indexee, celled est susceptible, entre autres, de mettre en oeuvre (en 

20 variante de la methode de lecture et de dechargement d'index illustree £ la figure 6A) 
la methode de lecture et dechargement d'index de base de donnees index6e de type 
espace de tables d I'aide la memoire tampon MX et realis6e par la methode 
LEC/IND/REORG/IND(ET) comportant les operations suivantes (voir figure 6B) : 
[201]-Autant de fois que necessaire jusqu'a avoir atteint la fin de I'index et vide la 

25 memoire tampon MX, lecture sequentielle des pages de Tindex en ne conservant que 
les pages d'index contenant au moins une cie, jusqu'S remplir la memoire tampon ou 
atteindre la fin de Tindex ; cette lecture se faisant dans les emplacements non utilises 
de la memoire tampon ou contenant une page marquee invalide; 

[202]- Recherche et remplacement des pages invalides dans la memoire tampon de 

30 Tindex a partir de la premiere page de la memoire tampon MX, 

[206A] ■ verification dans chaque page courante de la memoire tampon : 
- de Tabsence d'au moins un couple cie-RID superieur au dernier couple cie-RID traite 
en sequence logique (6crit dans le fichier index trie FX1 ou envoye en lecture d'espace 
de tables/base de donnees); ou 

35 - de ('exactitude de Texpression PXC < PXL- DMA ou PXC represente le numero dans 
Tindex de la page courante de la memoire tampon MX, PXL le numero dans Tindex de 
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la derniere page d'index lue et DMA la difference maximale autorisee entre pages 
d'index en cours de lecture; 

(202'B) • Dans I'affirmative d'au moins une des deux propositions, 6criture des couples 
cies - RID dans le fichier tri-index FX2, invalidation de la page courante PXC et retour a 
5 I'operation (201) pour lecture d'une nouvelle page index en sequence; a defaut on 
execute (203) ; 

[203] - Recherche de la page valide PXmin de la memoire tampon MX qui contient la 
cl6 la plus basse de toute la memoire MX ou en cas d'egalite de cie, le RID 
correspondant le plus bas; 
10 [204] - Traitement de la page PXmin en sequence logique comportant les operations 
suivantes : 

[204'A] - Lecture par ordre croissant de chacun des couples cie-RID de cette page 
PXmin et Venture directe de ces couples cie-RID dans le fichier index ordonne FX1; 
[204C] - Invalidation de la page PXmin traitee et retour a I'operation (201) pour 

15 lecture d'une nouvelle page index en sequence. 

Ainsi le dSchargement de T index selon cette derniSre methode conduit £ la 
creation d'un fichier virtuel FXV ordonne des couples cie-RID et la methode 
REORG/IND(ET) de reorganisation de I'index de la base de donn§es index6e et 
organis£e en espace de tables comporte alors les operations suivantes (voir figure 8B): 

20 [401X] - Lecture du contenu de I'index et creation des fichiers de couples cie-RID FX1 



[402X] - Si necessaire, tri du fichier FX2 par ordre de couples cie-RID croissants pour 
donner FX'2; 

[403X] - Fusion virtuelle des fichiers FX1 et FX'2; 
25 [404X] - Rechargement du ou des fichiers contenant I'index avec les couples c!6-RID 
ainsi ordonnes ou tries en respectant les parametres d'espace libre. 

II est & remarquer que ('absence de r operation de tri [402] et/ou [402X] 
resulte du fait que la lecture des lignes de I'espace de tables et/ou des pages d'index a 
pu etre faite directement dans I'ordre, ce qui advient lorsque la base de donn6es n'est 
30 pas trop desorganisee. 

Ainsi I'utilisation de la lecture sequentielle qui permet de lire un grand 
nombre de pages en une seule operation (les unites de disques du systeme poss6dant 
une fonction de lecture en masse de blocs contigus) acceifcre de fa?on significative les 
operations de reorganisation unitaires des bases de donn6es index6es, notamment les 
35 bases de donnees indexees de type espace de tables. 

II est a noter pour terminer ce point de reorganisation unitaire que si les deux 
methodes de reorganisation de la base de donn6es REORG/TABLE et de reorganisation 



et FX2; 
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de I'index REORG/IND(ET) peuvent etre mises en ceuvre conjointement, il apparaTt 
qu'en pratique ces deux methodes sont codSes separ6ment et mises en ceuvre comme 
des coroutines. Cette caracteristique est importante car elle donne plus de souplesse 
dans la preparation des plannings de reorganisation de I'ensemble des bases de 
5 donnees indexees notamment de type espace de table. 

Apres avoir presente les grandes lignes de la reorganisation unitaire des bases 
de donnees indexees structures en espaces de tables et de leurs index, il importe de 
revenir d la strategie globale de la reorganisation de I ensemble des bases de donnees 
du systeme d'information. 
10 La gestion des reorganisations « en Hgpe » 
La Strategie 

La strategie globale intdgre les reorganisations «en ligne » et « hors ligne ». Pour 
chaque objet du systdme informatique d'information on determine le seuil de 
desorganisation £ partir duquel une reorganisation « en ligne » est rentable. Si ce seuil 

15 est atteint sans qu'il est ete possible de reorganiser I'objet « hors ligne » (manque de 
disponibilite dans la fenetre « batch ») la reorganisation « en ligne » est Ianc6e dds que 
I'activite de mise £ jour est suffisamment faible pour que cette reorganisation soit 
valable. Cette reorganisation «en iigne » se fait en une seule operation sur une copie 
de I'objet en service. Les mises 3 jour eventuelles apparues pendant I'operation de 

20 reorganisation sont sauvegard6es sur un fichier intermediate traite en fin de 
reorganisation (les pages modifiees etant reperees par I'heure de la modification), le 
processus etant repete pour les nouvelles mises a jour eventuelles jusqu'3 epuisement. 
L'objet (la base de donn6es) une fois reorganise et mis a jour peut alors etre remis en 
service. 

25 En ce qui concerne les espaces de tables, c'est I'utilisation des parcours 

sequentiels d'index (en anglais index scans) par I'index primaire (index determinant le 
critere de tri de la reorganisation) qui determine la reorganisation des espaces de 
tables. En effet un espace de tables utilise seulement en acces direct n'a pas besoin 
d'etre reorganise car les cartographies d'espace (en anglais space maps), seules 

30 utilis6es pour determiner la possibilite d'une insertion, sont suffisamment peu 
nombreuses pour §tre conserver dans le pare de memoires tampons (en anglais buffer 
pool). 

En ce qui concerne les index, I'acces direct (par pointeurs verticaux) d I'index 
est utilise aussi bien en lecture qu'en mise S jour (c.a.d. modification du champ de 
35 donnees sauf indication contraire). Son temps d'Entr6e/Sortie est determine par le fait 
que les pages repr6sentant les deux derniers niveaux et qui dans la plus part du temps 
doivent etre lues physiquement, sont ou non proches Tune de I'autre sur le disque. 
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C'est le temps de positionnement pour la lecture de la page « feuille » qui determine la 
difference entre un index bien ou mal organist. 

Le parcours sSquentiel (« index scan » utilisant des pointeurs horizontaux) ne 
represente qu'un cout marginal par rapport 3 la lecture concomitante de I'espace des 
tables, tout en ayant le m§me critSre de performance que I'accds direct puisque si 
deux pages sont proches d'une troisidme elles sont relativement proches Tune de 
I'autre. Le parcours sequentiel n'intervient done pas dans la determination de la 
n6cessit6 d'une reorganisation. 
Les Donn6es utilisees 

II r6sulte de ce qui precede que les donnees d prendre en compte sont celles qui 
influent sur les performances des applications et sur le cout en termes de ressource de 
la reorganisation. Ces donnees sont de deux ordres ayant leurs origines sort dans les 
caracteristiques de I'objet a reorganises soit dans les caract6ristiques des unites du 
systeme d'information (traitement et utilitaires): 

i) les caracteristiques de I'objet £ prendre en compte sont celles de determinent le 
volume est l'6tat de I'objet : 

S = le nombre de CI (bloc physique ou page) de 4 Ko de I'objet, index compris en cas 
d'espace de table, 

NTL = le nombre total de lignes (RID si index), ou le nombre moyen par CI, 
D= le taux de desorganisation, c'est £ dire : 
Pour un espace de tables : 

DT = le pourcentage de lignes situees loin de la page qui contenait 3 I'origine la cie 
precedente au sens de I'index primaire ; 
Pour un index : 

Dl = le pourcentage de pages feuilles situees loin de la page non feuille qui pointe 
dessus. 

Pour calculer le nombre de lignes ou de RID on divise la taille utile du CI 
multiplie par le taux de remplissage estime, par la taille typique de I'entree. 

• La taille utile d'un CI est voisine de 4 K pour un espace de tables et depend de type 
de I'index et du nombre de sous pages et de la longueur des cies pour un index de type 1. 

• Le taux de remplissage estime de 0,85 pour un espace de tables et de 0,75 pour un 
index. 

• La taille typique est la movenne geometrique (racine nifeme du produit de n nombres) 
entre la taille maximum et la taille minimum (tmg 2 = tmax.tmin). Pour un index 
multiple la taille du RID est le minimum, la taille d'une entree unique le maximum. 
Pour un espace de tables ajouter 8 (prefixe + ID) S la taille de la ligne (a diviser par 3 
en cas de compression). 
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ii) Les caracteristiques des unites a prendre en compte sont celles qui influent sur le 
temps d'Entr6e/Sortie des traitements et utilitaires : 
• te temps de positionnement moyen Ts; 

- le temps de latence Tl f c'est ?a dire le temps n^cessaire pour faire un l / 2 tour ; 

- le nombre de blocs de 4K par piste de mSmoire sur disque. 

Est egalement £ prendre en compte le profil applicatif (c'est a le nombre 
moyen d'un tenement de Tapplication par unite de temps, par .exemple Theure). 

Pour un espace de tables, ('information utilisSe sera le nombre moyen de 
lignes lues par « index scan » (parcours sequentiel de Tindex) par heure. En fait 
remarquer qu'il n'est r§ellement utile de r6organiser un espace de tables que s'il y a 
des lectures en « index scans ». 

Enfin on s'interesse d la charge instantan§e lorsque Ton cherche a determiner 
Topportunite de lancer une reorganisation « en ligne » d un instant donne. Jusqu'S 
present on utilise le nombre moyen de mise & jour par objet et par heure. II serait 
opportun de travailler sur des previsions £ court terme de cette charge en utilisant des 
profils de journee d'exploitation. 
Le CoQt de la reorganisation : 

Le cout d'une reorganisation en ligne, exprime en temps d'Entre/Sortie est donn6 par 

la formule Fl suivante : 

C = S.(c + d.D) / (1 - e.q.U) dans laquelle : 

S est le nombre de pages ou taille de Tobjet, index inclus ; 

D est le taux de desorganisation ; 

c,d,e sont des constantes de la machine (systeme informatique) ; 
q = 1 si Tobjet est un index, 
sinon q = nombre d'index +1 ; 

U est la moyenne horaire du nombre de mises £ jour sur Tobjet, les mises d jour etant 
pour Tessentiel des modifications de champs dans des lignes existantes (sans veritable 
effet de desorganisation). 

On notera que la duree d'une reorganisation en ligne peut etre trds longue 
(plusieurs heures pour une premiere phase de reorganisation en continu de duree to) 
entraTnant la mise en memoire provisoire, pendant la premiere phase de 
reorganisation, d'un premier paquet des mises a jour de Tobjet. A la fin de cette 
premiere phase de duree to (temps passe de reorganisation Tr=to) intervient une 
deuxieme phase de la reorganisation plus courte (tl < to) que la premiere pour traiter 
ces premieres mises £ jour, d'ou Tapparition en fin de deuxieme phase (avec Tr=to+tl) 
d'un second paquet de mises a jour plus petit que le premier, et ainsi de suite jusqu'S 
extinction des mises jour. II en resulte que le temps total final de la reorganisation en 
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ligne Tf fait intervenir un facteur k <1 fonction de U moyenne horaire du nombre de 

mises d jour sur I'objet. 

Au depart de la reorganisation Tr = O 

Pour Tr=to, C= Co = S.(c+d.D) 

Pour Tr=to + tl f C= Co + k.Co = Co.(l+k) ou k < 1 

Pour Tr=to +tl + t2, C= Co + k.Co + k.k.Co = Co.(l+k+k 2 ) 

Finalement en fin de reorganisation Tr = Tf, avec: 

Tr=Tf=to+ + tn + , C= Co + k.Co + k 2 .Co + .. +k".Co+ 

Soit un cout final C= Co.(l+k+k 2 + ...+k n+ +.)= Co/ (1 - k) 

ou I'on retrouve la formule Fl si Ton pose k= e.q.U 

De la formule Fl on tire le cout moyen horaire de reorganisation si t 
repr£sente le nombre d'heures sSparant deux reorganisations : 
Cm = [S.(c + d.D) / (1 - e.q.U)] / t soit Fl' 
Le Cout de ne pas reorganiser : 

Le surcout de ne pas reorganiser par heure de traitement vaut : C* = Co*.D, 
ou Co* est le surcout horaire quand I'objet est totalement desorganise. 

D'une fagon generate on considdre que la desorganisation d'une base de 
donnees de type espace de tables resulte, quasi exclusivement des insertions de 
donn6es dans la base (nouvelles lignes creees), soit : 
D = i/S.r, ou 

i designe le nombre d'insertions depuis la dernidre reorganisation, 

S designe la taille de I'objet entier en pages, 

r est le nombre moyen de lignes par page de rentier, 

Si Ton suppose le taux horaire d'insertion constant = I 
D = l.t/S.r => C* = Co\l.t/S.r ou 

I designe le nombre d'insertions d I'heure, et 

t le temps ecouie depuis la dernidre reorganisation. 

Le surcout de ne pas avoir reorganise depuis t heures est G = Somme 
de Co* l.t.dt /S.r = Vz .CoM.tVS.r soit 
G = Vz Co*. D.t 

ou Somme de designe le signe mathematique de la fonction integrale 
Le surcout moyen horaire de ne pas avoir reorganiser vaut done : Cm* = Vfc 
.Co*.D formule F2 

le moment optimal de la reorganisation : 

Le cout moyen horaire total de la non reorganisation vaut :Cmt = Cm + Cm* 

II importe de reorganiser lorsque Cmt = Cm + Cm* est minimal. 
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Or 

Cm = [S.(c + d.D) / (1 - e.q.U)] / t soit avec S = l.t/D 
Cm = l.(c + d.D) / <1 - e.q.U).r.D formule Fl" 

Cmt = Cm + Cm* = Vfc.Co*.D+[l.(c + d.D) / (1 - e.q.U).r.D] soit la formule F3 

Cette fonction du type a.x + b + c/x passe par un minimum lorsque a -(c/j? )= O 

soit jt* = c/a, d'ou pour la valeur de seuil Ds solution de liquation suivante : 

Ds 2 = 2 l.c / (1 - e.q.U) r Co* formule F4 

Alternativement on montre que la fonction Cmt=Cm+Cm* admet un minimum 

lorsque les termes en D et en 1/D sont Sgaux {a.x = c/x\ soit : I.C / [(1 - e.q.U).r.D] = 

V z .Co*.D 

D'ou on retrouve la formule F4. 

II y a lieu de r£organiser lorsque D 2 dSpasse cette valeur Ds 2 , soit quand : 

D 2 > 2 l.c / (1 - e.q.U) r Co* ou, sous une autre forme, quand 

R' = D 2 r Co*.(l - e.q.U) / 2.I.C > 1 

Ou quand R' = R (1 - e.q.U) >1 avec 

R = D 2 r Co* / 2.I.C , soit la formule F5. 

Sachant que e.q.U doit §tre le plus faible possible, la reorganisation en ligne 
interviendra pendant que U (moyenne horaire du nombre de mise h jour sur Tobjet) est 
faible d partir du moment ou R >1. 

Ainsi le taux de seuil Ds est donn§ par la formule F5' suivante: R = Ds 2 r Co* / 

2.I.C-1 

i) Cas de IMndex 

Si Tobjet est un Index, chaque insertion coute n lectures et 1 gcriture si n est le 
nombre de niveaux d'index et chaque relecture coute n lectures. En supposant 3 
niveaux d'index le temps d'accds correspondant aux deux derniers niveaux sera : 

- Ts 2. Tl, si Tindex est reorganise 

- 2Ts + 2 Tl, si Tindex est d6sorganis6 

Ts d§signant le temps de d£placement de bras, Tl le temps de latence (1/2 tour du 
bras). En cas d'index d§sorganis6 le surcout en temps d'accfes par transaction est de Ts. 

Si t* est le taux de relecture de I'objet, c'est k dire le nombre moyen de fois 
qu'une entr£e sera relue. II est alors possible de connattre le nombre de transactions 
en fonction de I (nombre d'insertions d I'heure) soit : (t*+ 1) I . 

II en r§sulte que le surcoQt horaire d ne pas r£organiser quand I'objet est 
totalement d£sorganis§ Co* est Co* = (t*+ 1) I.Ts formule F6 
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On peut evaluer c (temps d'acces en E/S par la taille) en supposant dans le 
cas le plus difavorable que Putilitaire de reorganisation «en ligne » lit une piste 3 la 
fois puis perd son positionnement, done en nigligeant les icritures. 
c=(Ts + 3TI)/Nbp ou Nbp est le nombre de pages de I'objet. 
5 En posant Ts/Tl = V qui est une caractiristique de I'uniti de traitement on 

obtient 

R= D 2 r (t*+l)Nbp.V / [2(V+3>] formule F7 

Ainsi le taux de seuil pour I'index Dsl est donni par la formule F7' suivante : R= 

Dsl 2 r (t*+l)Nbp.V / [2(V+3>] = 1 
10 A titre d'exemple numirique non limitatif, on choisit : 

r= 200 (cli de longueur 10 octets) 

Nbp: 12(3390) 

V = 1.76 (3390-2) 

t* = 1 (une seule relecture) 
15 On obtient R = D 2 200.2.12.1,76/ 2.4,76 = D 2 8400/9,52 

soft R = 887.D 2 

II y aura lieu de reorganiser d partir de R > 1 (lorsque le taux U peut §tre 
considiri comme nigligeable), soit pour D 2 > 1/887 ou D > 0,0335, soit d partir d'un 
taux de seuil de disorganisation de I'index Ds = 3,35 %. 
20 ii) Cas de I'espace de tables 

Si Tobjet est un espace de tables, une lecture siquentielle d'index (index 
scan) engendrera un surcout de disorganisation par ligne diplacie de Ts + Tl. 
II en risulte un cout de disorganisation 
Co* - L.I.(Ts + Tl) 

25 ou L est la proportion des lignes accidies par index scan par rapport aux lignes 
criies. 

Par ailleurs du fait que les index sont reorganises simultaniment, il taut tenir 
compte du cout associi aux accis directs d travers ces index, 
soitCo*i = (t*i + l).ILTs 
30 d'ou le cout total moyen horaire £ ne pas disorganiser 
Cm* = %.L.I.D.(Ts+TI) + V 2 [S Co*i.Di 2 ./D 2 ].D 
Soit 

Cm* = y 2 .L.I.D.(Ts+TI) + y 2 Ts. S li.Di 2 .(t»i + 1)/D 
formule F9 
35 II est a noter : 

• que li = I dans le cas d'un espace de table monotable; 
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• que dans le cas g§n§ral on peut supposer que K = ki.l ou ki d§signe le cardinal relatif 
de la table associSe £ I'index i (et repr6sentatif de la dimension relative de cette table). 
Cela revient 3 ignorer les mises d jour entraTnant une modification de cl£ et £ supposer 
que les tables ont des dur§es moyennes de vie de lignes comparables. 

• que les t*i repr^sentent le taux d'acces direct au travers de chaque index done que, 
pour une table donnSe, S t*i repr6sente le cout d'accds a cette table. 

Supposons certaines reorganisations d'index faites, dans chaque intervalle ne 
contenant pas de reorganisation d'index, Di est une fonction lin§aire du nombre 
d' insertions I done de D. 

Di = ai.D - bi, oil ai = li.S.r / (I.Si.ri) = ki / ki= 1 
d'ou Di = D-bi 

Cm* = y 2 .L.I.D.(Ts+TI) + % Ts. S li.(D-bi) 2 .(t*i + 1)/D 
Cm* = y 2 .L.I.D.(Ts+TI) + V 2 Ts. S li.D.(t*i + 1) 
- Ts. S li.bi.(t*i + 1)+ V 2 S. Ii.bi 2 .(t*i + 1)/D 

avec Cm = l.(c + d.D) / (1 - e.q.U).r.D (cout moyen horaire pour r6organiser Tobjet) 

De fagon analogue a ce qui a d€j£ 6t§ presents ci-avant la fonction 
Cmt = Cm + Cm* admet un minimum local lorsque les termes en D et en 1/D sont 
6gaux soit : 

D 2 .[L.I.(Ts+TI)+Ts. S li.(t*i + l)]=2l.c/(l - e.q.U).r + Ts. S li. D 2 .(t*i + 1) 
D 2 .L.I.(Ts+TI)+Ts. S IKD^bi^t*! +l)=2l.c/(l-e.q.U).r 

En utilisant comme ci-devant c = (Ts + 3.TI) / Nbp et en substituant bi = D - 
Di on obtient 

R=r.Nbp[D 2 .L (V+l) + V. S ki(2DDi-Di 2 ) (t*i+l)]/ (2V+6) 
Formule F12 

Ou 

R= r.Nbp[D 2 .L (V+l) + V. S ki(D 2 -bi 2 ) (t*i+l)]/ (2V+6) 
Formule 12' 

Pour une base de donn6es monotable on a ki= 1, la formule devient 
R= r.NbpID 2 ^ (V+l) + V. S (D^bi 2 ) (t*i+l)]/ (2V+6) 
Formule F13 

Ainsi le taux de seuil DsT est donn§ par la formule F13' suivante: F13' 
suivante : 

R=r.Nbp[DsT 2 .L (V+l) + V. S (DsT^bi 2 ) (t*i+l)] /(2V+6) = 1 

A titre d'exemple num6rique non limitatif, on choisit pour un espace de table 
monotable £ 2 index: 

r= 15 (ligne de longueur 200 octets ; index 15% de la taille de I'espace de table) 
Nbp: 12(3390) 
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V = 1,76 (3390-2) 

L = 5 (chaque ligne fait I'objet de 5 parcours sequentiels dans sa vie) 
rl « 200 (cie de longueur 10 octets) 
r2 = 230 (cie de longueur 8 octets) 
5 t*l = 1 (une relecture directe) 
t*2 = 2 (2 relectures directes) 

En procedant comme presente ci-avant, il apparatt que le premier index II 
(Rl = 887.DI1 2 ) doit §tre reorganise d partir de Dsll= 0,0355 = 3,35% et que le 
second index 12 (R2 = 1531.DI2 2 ) doit etre reorganise a partir de Dsl2 = 0.0255 m 
10 2,55%. 

La base de donnees etant monotable on a ki= 1. La formule F12' se simplifie 
pour s'6crire : 

R= <15.12)/(2.<4,76))[<D 2 .5.<2,76))+ (l,76.2<D 2 -bl 2 )) + 
(l,76.3(D 2 -b2 2 )) soit 
15 R=180/9,52 [(13.8.D 2 + 3,52.D 2 + 5,28.D 2 ) - (3.52.M 2 + 5,28.b2 2 )] 

Soit R=[427.DsT 2 - 66,5.bl 2 - 100.b2 2 ]/10.000 ■ 1, formule F14, si les valeurs DsT, 
bl et b2 sont directement exprimees en % (pourcent). 

II est clair de la formule F14 que la valeur de seuil de reorganisation de 
I'espace de table DsT sera superieure a la limite Dinf solution de liquation 
20 Dinf 2 = 10.000/427= 23,4 , soit Dinf= 4,8 %. 

Aprds une reorganisation de I'espace de table et de ses deux index, tous les 
taux de d6sorganisation sont d z6ro avec DT = Dll = DI2= 0. 

La premiere reorganisation d'indexinterviendra pour Dsl2 = 2,55% 
(3 un instant ou la base de donnees et le premier index auront le m§me taux DT = 
25 Dll= 2,55% (< Dinf), les taux etant proportionnels aux nombres d'insertion de 
nouvelles lignes (ou RID pour les index). 

La seconde reorganisation d'index interviendra pour Dsll = 3,35% (3 un 
instant ou la base de donnees aura le m§me taux DT = 3,35% (< Dinf)). 

En supposant pour simplifier que les index puissent etre reorganises des que 
30 le taux ou seul limite est atteint, on peut examiner chaque intervalle d6fini entre deux 
reorganisations successives d'index et calculer par la formule F13 la valeur dans cet 
intervalle du taux limite pour I'espace de table (les valeurs de bl et de b2 etant 
donnees par la valeur instantanee de la disorganisation de I'espace table Ds lors des 
deux dernieres reorganisations d'index) et verifier que cette valeur limite appartient 
35 bien & Tintervalle considere ; & defaut I'intervalle consid6r6 et la valeur limite calcuiee 
ne seront pas retenus. 

On etudiera done la suite d'intervalles suivante : 
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[0:Dsl2MDsl2:Dsll],[Dsll:2.Dsl2],t2.Dsl2:2.Dsll], etc 

ou 2.Dsl2 et 2.Dsll correspondent respectivement a la seconde reorganisation du 
second et du premier index. 

En introduisant les valeurs numeriques la suite d'intervalles peut s'6crire : 
5 [0:2 I 55],[2,55:3,35],[3,35:5.1],[5,1:6,7I etc 

Compte tenu de la valeur de Dinf=4,8%, il y a lieu d'etudier I'eventualite d'une 
reorganisation de I'espace table dans I'intervalle [3,35:5,1], avec bl= 3,35 et b2=2,55 
(valeur de Ds lors de des deux premieres reorganisation d'index - premiere de II et 
premiere de 12) 

10 De la formule F14, on obtient DsT 2 =11380/487 =26,5 et DsT= 5,15% 

Cette valeur n'est pas acceptable car elle se situe en dehors de I'intervalle 
consid6r6. II en rSsulte que la reorganisation de I'espace table ne pourra intervenir 
qu'apres la seconde reorganisation du second index I pour laquelle DsT prendra la 
valeur 2x 2,55= 5,1. 

15 En reprenant cette procedure pour I'intervalle [5,1:6,7], avec bl= 3,35 et b2= 

5,1, obtient DsT 2 =13231/487= 31 et DsT= 5,56%. 

Si on prend U=0 la reorganisation de I'espace table et de ses deux index est 
souhaitable a partir d'un taux de desorganisation de 5,56% survenant dans I'intervalle 
consid6r6 & un instant precedant bien la seconde reorganisation du premier index. 

20 II est d noter en variante qu'il est interessant d'appliquer egalement le critere 

de rentabilite presente ci-avant a la reorganisation « hors ligne» (hi) dans la mesure 
ou des donnees existent. Pour ce faire, il y a lieu de remplacer dans la formule Fl le 
coefficient c(el) (temps d'Entre/Sortie en fonction de la taille de I'objet) par un 
coefficient correspondant £ la reorganisation « hors ligne », par exempie du type c(hl) = 

25 K.c(el) ou K = Rapport du temps d'execution de la reorganisation (hi) de I'objet sur le 
temps d'execution de la reorganisation (el) du m§me objet dans des conditions 
moyennes d'exploitation de la base de donnees indexee de type espace de table 
correspondante. 

II est ainsi possible de determiner si une reorganisation « hors ligne » est ou 
30 non utile. Les priorites existantes bas6es sur les taux de desorganisation sont 
egalement remplacees par des priorites bas6es sur la rentabilite, un objet plus lu 
qu'un autre etant prioritaire pour la reorganisation d taux 6gal de desorganisation. 
La gestion globale des reorganisations et copies « hors ligne » : 

La reorganisation d'un fichier « hors ligne » est consommatrice de temps 
35 machine qu'il est en general souhaitable de minimiser pour reduire le cout total de 
I'operation. 
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Pour ce faire I'invention propose 6galement une methode de gestion ou 
d'ordonnancement pr6par6e d'avance de I' execution en temps reel de programmes 
utilitaires de reorganisation (et/ou d'images copie) de maniSre a utiliser au mieux les 
ressources du systeme informatique d'information dont la fenetre « batch » (fen§tre de 
5 maintenance). 

La reussite et I'efficacite d'une telle methode repose sur la rapidite que ce 
soit la rapidite £ preparer et & mettre £ jour un plan d'activite ou planning des t§ches & 
exScuter et/ou la rapidity a lancer I'exScution des programmes preseiectionn6s. 

Avant d'exposer la methode de gestion ou d'ordonnancement selon 

10 I'invention, il importe de presenter brifcvement I'organisation et le fonctionnement d'un 
systfeme informatique d'information comportant un ensemble de fichiers ou bases de 
donn6es indexees repartis en divers objets reels constitues d'espace de tables, de 
partitions d'espaces de tables et d'index. 
Le svstfeme d'information : 

15 Les capacites « machine » du systSme d'information sont divisees en regions 

de traitement distinctes piloses de fagon unitaire par une region de contrdle. A chaque 
region de traitement sont affectees un certain nombre de taches ordonn6es et sont 
allouees les ressources necessaires en m6moires virtuelles et p6riph6riques (disques 
durs, imprimantes, memoires sur supports externes etc...)- Par souci d'efficacite en 

20 execution et en allocation de ressources materielles et/ou logicielles on affecte si 
possible £ chaque region de traitement des taches de meme type, telles que par 
exemple pour des t§ches g6n£ralement ex6cutables dans la fenetre « batch » des 
reorganisations de fichiers ou bases de donn6es (demandant beaucoup d'espace de 
disque) ou des copies images de fichiers (demandant des peripheriques de sortie 

25 externe, lecteurs de bandes magnetiques, lecteurs/graveurs de CD-ROM, etc.). 

A c6t6 des reorganisations de fichiers tels que bases de donn6es, la prise de 
copies des fichiers modifies constitue un imperatif de securite dans le domaine de 
I'exploitation de systemes informatiques. On distingue g6n6ralement trois types de 
copie, la copie en continue ou copie « journal » (en anglais «log»), la copie 

30 incremental qui ne prend que les modifications apportees aux fichiers et la copie 
totale ou copie image. 

En ce qui concerne les bases de donn6es, les systemes d'exploitation 
comportent assez souvent un dispositif logiciel de verrouillage interdisant la remise en 
service de la base de donn6e avant la prise d'une copie image. Ceci cree une 

35 interaction entre les plannings de reorganisation et de copie. 
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Les plannines 

Les plannings de reorganisation et de copie s'effectuent & partir de listes de 
priorites d'objets d reorganiser ou a copier qui seront traitees dans des regions de 
traitement diff6rentes reservees soit d la reorganisation soit £ la copie. 
5 La methode d'ordonnancement consiste a gen§rer a I'avance les objets r6els 

susceptibles de reorganisation au lieu de faire des combinaisons d'objets en temps 
r6el. Le nombre d'objets en est plus grand pour les objets partitionnes, mais les 
priorites et par consequent I'ordre logique d'enchaTnement des reorganisations sont 
calcuies initialement et rarement mis en cause. 
10 De ce fait les objets 3 reorganiser peuvent etre chatnes par priorite 

decroissante, m§me si certains sont mutuellement exclusifs. 

La copie utilise d'autres regions et peut travailler sur les objets eiementaires. 
La liste des objets & copier est done distincte de celle des objets a reorganiser avec un 
lien eventuel pour etablir si un objet 3 copier est aussi 3 reorganiser ou fait partie d'un 
15 objet d reorganiser. 

Le processus d'ordonnancement ou de creation de plannings peut se r6sumer 
de la fa?on suivante que se soit pour les copies ou les reorganisations : 
- determination ou preselection des objets £ traiter en priorite par la realisation d'un 
planning rapide. 

20 • tentative de creation d'une liste d'ordre d'execution des traitements par placements 
en « retro-planning » des objets preseiectionn6s par priorites croissantes dans des 
regions de traitements disponibles, ce qui permet de s'assurer de I'heure maximum de 
demarrage d'un traitement. Ainsi le dernier objet seiectionne dans une region avec 
reussite pour completer la liste devient le prochain objet d traiter POC ou POR. A 
25 defaut une nouvelle tentative de creation de liste sera effectuee sur d'autres 
hypotheses de placements ou d'affectations de regions de traitement. 

Ce processus est renouveie a chaque fin de traitement correspondant (copie 
ou reorganisation) en tenant compte de l'6tat reel des objets d cet instant. 

L'interet de l'op6ration de « retro-planning » ou planning inverse est de 
30 permettre a des gros objets non n6cessairement prioritaires d'etre traites avant qu'il 
ne soit trop tard (le temps de traitement encore disponible dans la fen§tre « batch » 
des regions de traitements libres devenant insuffisant). 

Dans la realite, les temps d'execution sont variables et il y a lieu de prendre 
une marge de securite concernant les temps d'execution (Kc = 1,20 pour les copies et 
35 Kr = 1,50 pour la reorganisation). 

En pratique chaque fois d'une region destin6e d la reorganisation devient 
libre, I'algorithme de planning de reorganisation recherche I'objet reel dont la priorite 
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est maximale (planning rapide), le preseiectionne et poursuit les tentatives 
d'affectations sur le m§me principe en examinant les consequences sur sa selection 
initiate (premier objet a reorganiser). En particulier : 

• si I'objet en phase d'affectation est une partition contiguS a une partition d'un mime 
5 espace de table deja s6lectionnee en premier, cette nouvelle partition sera ajoutee £ la 

selection initiale d titre d'objets lies dans la mesure ou le nombre maximum de 
partitions seiectionn6es pour etre traitees ensemble n'a pas encore ete atteint (toutes 
les partitions contiguSs seiectionnees seront reorganises en meme temps) ; 

• si I'objet en phase d'affectation est I'espace de table dont I'objet de la selection 
10 initiale est un index, I'espace de table (et ses index) remplacera I'index de la selection 

initiale et les eventuelles selections des autres index seront annuies (les index d'un 
espace de table sont toujours reorganises avec celui-ci). 

Le processus sera partiellement reexecute 3 chaque modification de I'objet 
seiectionne en premier (selection initiale). De ce fait si de nombreux espaces tables du 
15 systdme d'information sont partitionn6s, le nombre de remise en cause peut devenir 
important. 

De fa^on analogue chaque fois d'une region destinee £ la copie devient libre, 
I'algorithme de planning de copie recherche I'objet eiementaire dont la priorite est 
maximale (planning rapide), et refait un planning de reorganisation pour verifier si cet 
20 objet est pr6vu ou non pour une reorganisation dans la fenetre « batch ». Dans 
I'affirmative I'objet est enleve provisoirement du planning des copies. 

Par ailleurs, les priorites sont comparees entre les listes 'reorganisation' et 
les listes 'copie' ; des images copies plus prioritaires sont susceptibles d'emp§cher 
une reorganisation du seul fait que celled g6ndre une copie et vice versa. 
25 Le planning rapide 

Le planning rapide consiste d determiner les objets £ traiter en limitant le 
temps global (la charge) d la somme des durees disponibles dans les regions de 
traitement. 

Le planning rapide de la copie consiste & prendre les objets dans I'ordre 
30 decroissant des priorites il est done aussi simple £ realiser qu'un tri d'objet. II permet 
de donner une evaluation rapide du temps de fen§tre residuel en fonction de la priorite. 
II peut etre ajuste en fonction des objets ajoutes par le planning rapide de 
reorganisation. 

Le planning rapide de reorganisation prend en compte les liens entre objets 

35 reels : 

- si un objet est contenu dans un autre, on planifie le contenant ; 
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• si deux objets ont une partition commune sans que Tun contienne I'autre, on ptanifie 
celui qui d la plus haute priority. 

Le planning rapide de reorganisation travaille egalement dans I'ordre 
d6croissant mais il est capable de remettre en question reiimination de gros objets en 
5 fin de fenetres. 

La rapidite des plannings rapides tient £ ce qu'ils sont Iimit6s dans leurs 
retours en arriSre et ne remettent pas en cause les priorites des objets. 

La boucle la plus interieure est celle qui cumule les temps de copie en testant 
si un objet est a la fois copie et reorganise. II est possible d'introduire un curseur sur 
10 Tobjet a copier, sachant que le parcours complet n'est necessaire que si des 
incompatibilites ou remise en causes ont ete detectees. 
Le$ priorites 

Les priorites relatives de copies et reorganisation sont prises en compte de 
maniere suivante : 

15 Pour les reorganisations necessitant une image copie, on v6rifie qu'elle est 

possible (planning rapide) en tentant d'ins6rer I'objet (s'il n'y est pas d6j£) au planning 

provisoire de copie avec sa priorite de reorganisation. 

Ainst si ce sont les regions de copie qui limitent le nombre d'objets, cette 

limite se fera £ des priorites voisines tant pour la reorganisation des objets n6cessitant 
20 une image copie que pour la copie des autres objets. 

Par contre si ce sont les regions de reorganisation qui limitent le nombre 

d'objets, des copies d'objets beaucoup moins prioritaires peuvent avoir lieu. 

Les specifications de la methode de qestion et d'ordonnancement de I'execution de 

logiciels utilitaires de reorganisation de bases de donn6es ind ex6es. 
25 Les Donnees 

Les objets el&menteires 

Les objets eiementaires sont les plus petits objets susceptibles d'un 

traitement (reorganisation et/ou copie) et pour lesquels on est capable de mesure un 

taux de d6sorganisation. 
30 Ces objets sont utilises pour I'image copie et comme intermediates pour 

generer des objets de reorganisation. 

Les objets eiementaires pour lesquels une image copie est $ faire sont 

chames (liste PRIOCOPIE) entre eux par priorites decroissantes et tailles croissantes 

(la priorite la plus haute etant donn6e a I'objet dont la derniere copie remonte le plus 
35 loin dans le temps). Les ajouts aprds reorganisation se font en effet en tete de la liste 

PRIOCOPIE. 
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Tous les objets eiementaires faisant I'objet d'une copie (y compris, 
ulterieurement, apr£s leur reorganisation) comportent un pointeur de pile dans I'ordre 
des priority croissantes qui est valorise par le planning de copie. 
Les objets reels 

5 Les objets reels sont ceux qui peuvent etre reorganises sans entraTner la 

reorganisation d'autres objets (ex ; espaces de tables + index non pris isoiement). Les 
objets reels sont crees £ partir d'objets eiementaires (espaces de tables, index et 
partitions). 

La priorite de chaque objet reel est le barycentre des taux de desorganisation 
10 des composants avec leurs tailles pour coefficients. On rappelle que le taux de 
desorganisation d'un objet est donne par le rapport nombre d'insertions (lignes ou RID) 
sur la taille de I'objet. Les objets r6els sont ranges dans la liste des priorites de 
reorganisation (liste PRIOREORG) par priorites decroissantes. 

La priorite etant definie comme ie rapport gain / coOts, le gain d'un objet est 
15 calcuie comme le produit de sa priorite par le temps de sa reorganisation. 

Les objets reels sont cha?n6s avant-arridre afin de permettre le parcours dans 
les deux sens et les operations de suppression et de changement de priorite qui ont 
lieu chaque fois qu'une reorganisation est lancee. 

Le planning rapide utilise egalement une liste de suppression (liste SUPP) 
20 permettant de diff6rer la suppression d'objets jusqu'3 la confirmation de la necessite 
de ces suppressions par la selection de I'objet courant incompatible avec les objets 
supprimes. 

II est possible d'introduire une sous-chatne d'objets seiectionn6s (ou ayant 
fait I'objet de tentatives de selection) afin d'eviter, lors de la phase de remise en cause 
25 d'avoir £ examiner de nombreuses combinaisons de partitions incompatibles avec les 
choix anterieurs. 
L 'objet partition ne 

Pour un espace de table contenant n partitions il y 2 n -l objets reels possibles 
pour la reorganisation, ce qui est irrealiste. On se limite aux combinaisons de 
30 partitions contigues dans I'ordre des priorites soient £ Vz n.(n+l) objets. Si le nombre 
maximum de partitions r6organisees simultanement est p<n f le nombre d'objet reels 
se reduit d % p.(2n-p+l). 

Par ailleurs il est necessaire de pouvoir repondre rapidement aux questions 
suivantes : 

35 i) • un objet est-il contenu dans un autre ? 

ii) - deux objets ont-ils une partition commune ? 
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Pour faciliter la reponse & ces questions on associe d chaque objet un tableau 
de bits (en anglais bitmap) marque a 1 pour chaque partition de I'objet et on procfede 
a des comparisons des « bitmaps ». 
Objets globaux 

5 Les objets globaux sont les espaces de tables. 11 sont destines & contenir les 

informations relatives £ la partie planifiee : 

Les informations temporaires utilises par le planning rapide sont : 
• un pointeur vers une liste de ses sous-objets reels seiectionnes, une valeur non nulle 
indiquant qu'une partie de I'objet est h rSorganiser ; 
10 - un indicateur de reorganisation de I'ensemble de I'espace de tables ; 

- un indicateur de copie d'une partie de I'espace de table ; 

■ une « bitmap » des reorganisations des partitions de I'espace de tables . 

- une « bitmap » des reorganisations des partitions d'index. 

II y a un pointeur de chaque objet 6l6mentaire ou r6el sur I'objet global 
15 correspondant. 

Enfin les objets reels seiectionnes d'un meme espace de table sont chainSs 
entre eux par le planning rapide dans la liste de selection (liste SELECT/OR) de I'objet 
global. 

Regions de traitement 

20 Chaque region de traitement est affectee soit a la copie soit S la 

reorganisation. La recherche du prochain objet k reorganiser ou copier a lieu quand 
une region est Iib6r6e par la fin de la reorganisation ou la copie precedente. 

Le planning consiste done d valoriser un pointeur de la r6gion de traitement 
vers le prochain objet a traiter. 

25 Afin de permettre I'anticipation, on conserve pour chaque region I'heure 

relative estimee de fin du traitement en cours dans la region, laquelle est initialement 
nulle. 

Les Traitements : 

Les traitements ci-apr£s sont donnees & litre d'exemple non limitatif d'un 
30 mode d'exploitation de la mise en ceuvre de la methode de gestions des 
reorganisations et des copies d'un ensemble de bases de donnees indexees selon 
I'invention. Sans sortir du cadre de I'invention, ces traitements peuvent faire I'objet de 
variantes et de modifications diverses pour remplir des fonctions techniquement 
identiquesou equivalentes . 
35 A Planning rapide 

On rappelle que le planning rapide a pour seul but de determiner les objets 
pouvant etre reorganises dans la dur6e r6siduelle de la fen§tre « batch » et non de 
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calculer Pheure de debut des reorganisations. Les seules informations utilisables sont 
Pindicateur de selection de chaque objet reel et les indicateurs d'affectation (partie 
planifiee et pointeurs). 

Le planning rapide de reorganisation PRR* comporte les six phases 

5 operationnelles suivantes : 
Initialisation 
Boucle sur objets 

Elimination des intersections d'objets 
Remise en cause des choix precedents 
10 Verification de la suffisance du temps copie 
Selection de Pobjet courant 

La phase op6rationnelle ^Initialisation comporte les operations suivantes : 
• Pour tout objet reel de la liste, annuler Pindicateur de selection IndS/OR ; 

- Pour tout objet global OG de la liste, annuler le pointeur de liste de selection 
15 PointLS/OG et annuler la partie planifiee de I'objet PPO/OG; 

- Initialiser le limiteur de remises en cause £ 10.000 ; 

. Initialiser E = temps minimum de traitement = minimum de (duree unitaire de 
reorganisation + copie des objets reels d reorganiser OR) ; 
Initialiser Temps residuel de copie TRC = temps restant aprds execution des copies 
20 en cours et des copies Ii6es aux reorganisations en cours ; 

Initialiser Temps residuel de reorganisation TRR = temps restant aprfcs execution 
des reorganisations ; 

. Initialiser : Prochain Objet £ Copier POC = premier objet de ta liste finale (en r6alit6 
une liste virtuelle car seul le premier objet de cette liste importe). 
25 Nota : 

1) Cette phase d'lnitialisation debutant le processus de PRR* est notamment lancee a 
chaque fin d'une tSche de reorganisation (reorg + copie) dans une region de traitement 
correspondante. 

De la m§me fa$on h chaque fin de tSche de reorganisation les listes de 
30 priorites PRIOREORG pour les objets reels et PRIOCOPIE pour les objets eiementaires 
sont remises a jour. 

2) Au tout depart des reorganisations on a : 

TRC = Duree fenetre o batch » x Nb de regions de copie, TRR = Duree fenetre 
« batch » x Nb de regions de reorganisation. 
35 La phase operationnelle de Boucle sur objets comporte les operations 

suivantes : 

Pour tout objet r6el de la liste PRIOREORG jusqu'& ce que TRR < E : 
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- Marquer la selection possible 

- Annuler le pointeur de la liste SUPP 

• Initialiser Temps Provisoire de Copie TPC = TRC 

- Initialiser Temps de Reorganisation TR = Dur6e de reorganisation de I'objet courant OR 

5 La phase op6rationnelle ^Elimination des intersections d'objets comporte 

les operations suivantes : 

Pour tous les objets globaux associ6s <fc I'objet courant OR, Faire : 
Si le pointeur de la liste de selection SELECT/OR de I'objet global associe i I'objet 
courant est non nul (ce qui indique qu'il y a d6ja au moins un objet reel s6lectionn6), 
10 Faire : Si la partie planifi6e de I'objet global OG est contenue dans la partie 

planifi6e de I'objet courant OR : 

Faire pour tout objet r6el B de la liste de selection : 
Si B marque seiectionne alors : 
i) Ajouter le temps additionnel de copie de B au TPC 
15 ii) Soustraire la dur6e de reorganisation de B du temps de reorganisation TR 

iii) Placer B dans la liste de suppression SUPP 
sinon 

Si la partie planifiee de I'objet global OG a une intersection non vide avec la 
partie planifiee de I'objet courant : 
20 Marquer selection de I'objet courant OR impossible 

La phase operationnelle de Remise en cause des choix precedents comporte 
les operations suivantes : 
Si selection possible 

Si duree de reorganisation + copie de I'objet courant OR > dur6e r6siduelle 
25 dans la fenetre « batch » de dans la region disponible, alors 
Marquer selection de I'objet courant impossible 
Sinon (duree reorg + copie < duree r6siduelle « batch ») 
Si le temps de reorganisation (duree de reorganisation de I'objet courant) 
> dur6e r6siduelle de reorganisation 
30 Initialiser : gain residuel = gain de I'objet courant 

Initialiser : temps restant £ gagner = duree de reorganisation de I'objet 
courant - duree residuelle de reorganisation 

Faire pour tout objet r6el B (d6j£ seiectionne) de la liste SELECT/OR en 
commensant par le precedent de I'objet courant OR et dans I'ordre de priorites 
35 croissantes tant que le limiteur des remises en cause >0 et que le temps restant d 
gagner < 0 : 
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Si B est seiectionne, sans etre sous-objet de I'objet courant, et si gain 
B < gain r6siduel (= gain de I'objet courant OR) 

Soustraire le gain de B du gain rSsiduel 

Soustraire la dur§e de reorganisation de B du temps restant £ gagner 
5 Ajouter le temps additionnel de copie de B au temps provisoire de copie 

Placer B dans la liste de suppression SUPP 
D6cr6menter le limiteur de remises en cause 
Si le temps £ gagner est >0 

Marquer selection de I'objet courant impossible 
10 Sinon selection possible soit parce que le temps gagner aprds ('elimination de 

B est < O, soit par ce que temps de reorganisation (duree de reorganisation de I'objet 
courant) < dur6e r6siduelle de reorganisation. 

La phase operationnelle de Verification de la suffisance du temps copie 
comporte les operations suivantes : 
15 Si selection possible 

Initialiser : Temps additionnel de copie de I'objet courant = temps de copie 

de I'objet courant 

Si copie a faire pour I'objet courant OR, 

Faire pour tout objet de la liste des objets restant d copier (liste PRIOCOPIE) 
20 tant que la priorite de I'objet £ copier > & la priorite de I'objet d reorganiser 

Soustraire le temps de copie de I'objet & copier du temps provisoire de 

copie 

Mais si I'objet & copier est un sous-objet de I'objet courant £ reorganiser 
Soustraire le temps de copie de I'objet & copier du temps provisoire 
25 de copie temps residuel de copie) 

Si le temps additionnel de copie de I'objet courant > temps provisoire 

de copie 

Marquer selection de I'objet courant impossible 
La phase operationnelle de Selection de Pobjet courant comporte les 
30 operations suivantes : 

Si selection possible 

Positionner I'indicateur de selection IndS de I'objet courant ; 

Positionner I'indicateur d'affectation de I'objet global associe a I'objet courant ; 

Noter la partie planifiee PPO de I'objet global associe 3 I'objet courant OR; 
35 Valoriser : pointeur (suite) de selection de I'objet courant OR = pointeur liste 

de selection PointLS de I'objet global OG ; 
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Valoriser : pointeur liste de selection PointLS de I'objet global = adresse de 
Tobjet courant OR (I'objet courant est ajoute la liste de selection SELECT/OR ); 

Soustraire le temps additionnel de copie de I'objet courant du temps r6siduel 
de copie TRC ; 

5 Soustraire la dur6e de reorganisation de Tobjet courant OR du temps r6siduel 

de reorganisation TRR ; 

Si le pointeur de liste de suppression est non nul 

Faire pour tout objet r6el B de la liste de suppression SUPP: 
Si B est marque seiectionn6 
10 Annuler I'indicateur de selection de B 

Ajouter la dur6e de reorganisation de B au temps r6siduel de 

reorganisation TRR. 

Nota : il n'est pas utile d'enlever B de la liste de selection car seuls les objets 

reels OR definitivement seiectionnes et marques par I'indicateur de selection seront 
15 consid6r6s comme tels et examines par la suite. 

B Prochain Objet a Copier 

La recherche du prochain objet d copier est effectuee chaque fois qu'une 

region est Iiber6e par une image copie termin6e ou qu'une region est disponible et 

qu'un nouvel objet a 6t6 introduit suite £ une reorganisation. Les objets doivent etre 
20 tries par priorites d6croissantes et tailles croissantes, les objets provenant des 

reorganisations etant places en tete de liste. 

Le planning s'effectue du moins prioritaire au plus prioritaire et il est possible 

qu'un gros objet (longue copie) deborde de la region de copie qui lui a ete attribuee. 

Cette situation est acceptable dans la mesure ou Ton s'est assure que I'objet tenait 
25 dans la region du point de vue Temps Residuel de Copie et du fait qu'une technique 

valable de planification consisterait d enlever de cette region un objet moins prioritaire 

deji seiectionne et de le placer dans une autre region, ce qui ne changerait pas la 

selection pour cette region. 

Le pointeur prochain objet S copier est valorise pour chaque region, mais 
30 pour la raison citee pr6cedemment, il est recommande de refaire le planning d chaque 

fois, meme initialement quand toutes les regions sont disponibles. 

Enfin il est possible que le planning copie choisisse un objet qui 

n'appartienne pas (encore) a la liste de copie parce sa reorganisation n'est pas 

terminee. Dans ce cas on se met en attente (region disponible). 
35 Le traitement Prochain Objet a Copier comporte les deux phases 

operationnelles suivantes : 

Selection des objets d copier 
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R6troplanning de copie 

La phase operationnelle de Selection des objets & copier 
comporte les operations suivantes : 
Faire un planning rapide de reorganisation PPR*; 
5 Initialiser les piles de selection de copie a vide ; 

Initialiser : temps r6siduel de copie TRC = temps total de fen§tre « batch » restant 
disponible dans les regions « copie » apres execution des copies en cours ; 
Initialiser EC = minimum (dur6e unitaire de copie des objets £ r6organiser OR) 
Faire pour toutes les regions de reorganisation, 
10 Si region active 

Si image copie de I'objet en cours de reorganisation a faire, 

Faire pour tout sous-objet pouvant etre copie separement (partition) 
Soustraire le temps de copie du sous-objet de la dur6e residuelle 

de copie 

15 Placer le sous-objet courant en haut de la premiere pile de 

selection de copie. 

Faire pour tout objet reel seiectionn6 de la liste des objets OR d r6organiser 
SELECT/OR dans I'ordre des priorites d6croissantes : 
Si image copie de I'objet courant OR & faire, 
20 Faire pour tout sous-objet pouvant etre copie separement (partition) 

Soustraire le temps de copie du sous-objet de la duree residuelle de copie 
Placer le sous-objet courant en haut de la premiere pile de selection 

de copie. 

Faire pour tout objet de la liste des objets a copier OC dans I'ordre des 
25 priorites decroissantes, tant que la dur6e residuelle de copie TRC > EC 

Si le temps de copie de I'objet OC < duree residuelle de copie TRC, 

Si I'objet h copier OC n'est pas deja dans la premiere pile (I'objet OC est 
un sous-objet ; verification possible par test de la partie reorganis6e de I'objet global 
en cas de partition), 

30 Soustraire le temps de copie du sous-objet de la duree residuelle de copie 

Placer le sous-objet courant en haut de la seconde pile de selection 

de copie. 

Placer la premiere pile de selection de copie sur la seconde (constituant ainsi la liste 
SELECT/COPIE). 

35 La phase operationnelle de Retroplanning de copie comporte les operations 

suivantes : 

Faire pour toute region de copie : 
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Duree de la region = Duree de la fenetre - heure relative estim6e de fin de 
traitement en cours dans la region 

Dur6e consommee region = 0 

Initialiser le premier pointeur objet d copier de la region courante d 0. 
5 Faire de haut en bas pour tout objet de la pile de selection de copie : 

Si temps de copie de Tobjet courant OC < duree de la region la plus longue ; 

Rechercher une region dont la duree consommee est minimale ; 

Si temps de copie de Tobjet OC > duree de la region courante - durSe 

consommee 

10 Rechercher une region pour laquelle : dur6e de la region - duree 

consommee de la region -temps de copie de Tobjet courant soit minimal et positive ou nulle, 
Si aucune region ne convient 

Rechercher une region pour laquelle : duree de la region - duree 
consommee de la region -temps de copie de Tobjet courant soit maximale (c.a.d 
15 minimale en valeur absolue) et le temps de copie de Tobjet courant < dur6e de la 
region, 

Si Tobjet courant OC appartient £ la seconde pile, 

Valoriser rpointeur premier objet £ copier POC de la region courante = 
adresse de Tobjet courant OC, 
20 Ajouter la duree de copie de OC a la dur6e consommee de la region courante. 

C Prochain Objet h R6organiser 

La recherche du prochain objet £ reorganiser est effectuSe chaque de fois 
qu'une region est Iib6ree par une reorganisation terminee. Prealablement les priorit6s 
ont du etre calcuiees ou corrigees et les objets reels tries dans Tordre des priorites 
25 d6croissantes. 

Comme pour la copie, le planning s'effectue du moins prioritaire au plus 
prioritaire. On commence par planifier les copies engendr6es par les reorganisations, 
ce qui permet de calculer une heure limite de fin de reorganisation pour chaque objet 
devant etre copi6. 

30 Le temps disponible de chaque region de reorganisation est divise en trois 

parties : 

1 - la duree consommee effectivement par les reorganisations planifi6es 

2 - la duree gaspiliee par le temps reserve £ la copie apres reorganisation 

3 - la duree residuelle allant du d6but d la premiere reorganisation 

35 Le processus tente de remplir la dur6e gaspiliee par des reorganisations 

d'objets ne necessitant pas de copie. 
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Quand un objet d reorganiser est s6lectionn6, i! est retire de la liste ainsi que 
ses index (si applicable) et tous les autres objets qui ont des partitions communes avec 
cet objet. Les priorites des autres objets pouvant partager un index avec celui-ci sont 
egalement recalcuiees (pour tenir compte de I'impact de la reorganisation de I'index) 
5 et ces objets sont replaces aux bons endroits dans la liste des objets reels £ 
reorganises 

Le traitement Prochain Objet & Reorganiser comporte les quatre phases 
opgrationnelles suivantes : 
Retroplanning de copie 
10 Retroplanning de reorganisation 

Identification de la region de traitement 
Inscription de I'objet au planning 

La phase op6rationnelle de Retroplanning de copie 
comporte les operations suivantes : 
15 Faire un planning rapide 

Faire pour toute region de copie : 

Duree consomm6e de la region = 0 
Faire pour tout objet r6el OR seiectionne de la liste des reorganisations SELECT/OR 
(dans I'ordre des priorites croissantes) 
20 Initialiser :'temps d r6server pour copie de I'objet courant '= 0 

Si image copie de I'objet courant OR a faire, 

Faire pour tout sous-objet pouvant etre copie s6par6ment (partition), 

Rechercher une region dont la duree consommee est minimale, ci- 
apr&s region courante 

25 Ajouter le temps de copie du sous-objet a la duree consomm6e de la 

region courante, 

Valoriser 'temps & r6server pour copie de I'objet courant' = max 
(temps £ r6server pour copie de I'objet courant OR, duree consomm6e de la region 
courante) 

30 La phase operationnelle de Retroplanning de reorganisation comporte les 

operations suivantes : 
Faire pour toute region de reorganisation : 

Dur6e de la region = Dur6e de la fen§tre - heure relative estim6e de fin du 
traitement en cours dans la region. 
35 Duree consommee dans la region = 0 

Duree gaspiiiee dans la region = 0 

Pointeur premier objet d r6organiser de la region courante = 0 
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Faire pour tout objet reel OR s6lectionne de la liste SELECT/OR dans I'ordre des 
priorites croissantes : 

Faire pour chaque region 

Si I'image copie de I'objet courant OR d faire, 
5 Calculer dernier d6lai de la region = duree de reorganisation de I'objet 

courant + max de [temps i r6server pour copie de I'objet courant, (dur6e consommee 
de la region + duree gaspiliee de la region)] 
Sinon, 

Calculer le dernier deiai de la region = dur6e consommee de la region 
10 + max de[(dur6e de reorganisation de I'objet courant, durSe gaspille de la region)] 

La phase operationnelle de identification de la region de traitement 
comporte les operations suivantes : 
Rechercher une region dont le deiai est minimal, 
Si dernier d6lai de la region courante > duree de la region courante, 
15 Rechercher une region pour laquelle : [duree de la region courante * dernier 

d6lai de la region courante] est minimale et positive ou nulle, 
Sinon, si aucune region ne convient, 

Rechercher une region telle que : [valeur absolue de (duree de region - 
dernier deiai de la region courante)] est minimale, et [duree de reorganisation + copie 
20 objet courant] < duree de la region. 

La phase operationnelle de Inscription de I'objet au planning comporte les 
operations suivantes : 

Si image copie de I'objet courant OR a faire ou duree gaspiliee de la region courante = O, 

Valoriser: pointeur premier objet £ r6organiser POR de la region courante = 
25 adresse de I'objet courant OR, 

Ajouter la duree de reorganisation de I'objet courant OR 3 la duree consommee de la 
region courante, 

Valoriser : duree gaspiliee de la region courante = dernier deiai de la region courante - 
dur6e consommee de la region courante. 

30 Lorsque Tune des deux regions de traitement identifiees concernees 

(reorganisation ou copie) devient disponible, le systdme lancera, en Tabsence de tout 
evenement de remise d zero RAZR=1 ou RAZC=1 survenu entre temps pour le 
traitement conceme, soit une reorganisation de I'objet POR (prochain objet d 
reorganiser) correspondant, soit une copie de I'objet POC correspondent (prochain 

35 objet £ copier). 

Une fois le traitement lance le processus d'identification IDPOR et/ou IDPOC 
reprendra, les listes PRIOREORG et PRIOCOPIE etant mises £ jour en continue, 
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jusqu'a epuisement du temps de reorganisation et/ou de copie imparti aux diverses 
regions de reorganisation et de copie correspondantes dans la fen§tre « Batch ». 

Bien entendu la methode de gestion des reorganisations et de copies dans un 
ensembles de bases de donn6es index£es d'un systeme d'information selon I'invention 
5 n'est pas limitee au mode de mise en ceuvre decrit ci-dessus et couvre d'autres 
variantes et modifications qui pourraient §tre appr6ciees par I'homme de metier tout 
en restant dans le cadre des revendications presentees ci-apr&s. 

En particulier la methode de gestion selon I'invention utilisee pour & la 
reorganisation « hors ligne » (off line) des bases de donn6es est egalement applicable a 
10 la reorganisation des bases de donnees « en temps r6el » ou « en ligne » (on line) selon 
une methode mixte, la reorganisation « hors ligne » et la reorganisation «en ligne » 
n'etant pas exclusive Tune de Pautre. 
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REVEND1CATIONS 



1. Methode de gestion des reorganisations dans un ensemble de bases de donnSes 
index6es d'un systeme informatique d'information adaptee & la reorganisation « hors 
ligne » dans au moins une region de traitement de reorganisation du systeme, 
5 caracteris6e en ce qu'elle comporte ies phases operationnelles suivantes : 

(10) • Creation et maintien par mise a jour en continu d'une liste PRIOREORG des 
objets £ r6organiser par priorite decroissante fonction de retat de desorganisation des 
objets d r6organiser ; 

(20) - Execution du processus IDPOR d'identification du premier ou prochain objet 
10 d reorganiser POR avec, a chaque 6v6nement RAZR=1 interne au systeme pour lequel 
la selection du premier ou prochain objet & reorganiser doit dtre remise en cause, 
interruption et remise d zero et nouvelle execution du processus IDPOR, lequel 
processus comportant Ies etapes suivantes : 



(21) - Etablissement d'un planning rapide de reorganisation PRR d I'aide de la liste 



15 PRIOREORG et du temps operationnel residue! disponible TRR dans I'ensemble des 
regions de reorganisation et d'une liste de selection SELECT/OR d'objets d reorganiser 
OR ordonnes par priorites decroissantes optimisees en fonction du gain de la 
reorganisation de chaque objet OR, ledit gain etant d6fini comme le produit d'un 
facteur representatif du taux de desorganisation d'un objet OR par le temps de 

20 reorganisation de cet objet; 

(22) • Etablissement d'un retroplanning de reorganisation dans lequel pour tout 
objet courant d reorganiser OR extrait de la liste SELECT/OR par priorite croissante 
pour favoriser le traitement avance des objets de plus grandes tailles possibles, on 
calcule pour chaque region de reorganisation le dernier deiai de la region DDRR, 

25 representant dans la fenetre « batch » allouee £ la reorganisation « hors ligne » le 
temps minimal necessaire £ la reorganisation de I'objet courant OR, 6gal dans le cas 
present d la duree de temps consomme DCRR plus le temps de reorganisation de 
I'objet courant DROR; 



(23) • Identification de la region de traitement RTR de I'objet courant OR par 



30 adequation optimisee entre la duree de traitement disponible dans ladite region DRR 

avec la duree de traitement DROR n6cessaire pour la reorganisation de I'objet POR 

avec DRR - DDRR minimal <0 ; 

(24) • Inscription de I'objet courant OR comme prochain objet £ reorganiser POR 

au planning de la region identifiee en valorisant le pointeur POR correspondant a 
35 I'adresse de I'objet courant OR et en augmentant la dur6e de temps consomme DCRR 

dans la region du temps de la reorganisation DROR. 
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(30) - Lancement de la reorganisation de I'objet POR dSs que la region de traitement 
de reorganisation RTR identifiee est liberee en I'absence de tout evdnement RAZR=1 
survenu entre temps ; Remise & z6ro et nouvelle execution du processus IDPOR. 

2. Methode de gestion selon la revendication 1, caracteris6e en ce que I'ordre 
5 optimal des reorganisations est coordonnS avec I'ordre des copies de sauvegarde 

d'objets du systSme d'information en tenant compte des reorganisations en cours ou 
juste effectu6es. 

3. Methode de gestion selon la revendication 2, caracterisee en ce que I'ordre des 
copies de sauvegarde est modifie par I'execution en premiere priority pour au moins 

10 un objet £ reorganiser OR, de la copie dudit objet OR au plus tdt en fin de traitement 
de reorganisation. 

4. Methode de gestion des reorganisations d'un ensemble de bases de donn£es 
index^es d'un systeme d'information adaptee £ la reorganisation « hors ligne » dans au 
moins une region de traitement de reorganisation selon I'une des revendications 13 3, 

15 caracterisee en ce qu'elle integre I'organisation des copies dans au moins une region 

de traitement de copie et comporte les phases op6rationnelles suivantes: 

(40) - Creation et maintien par mise a jour en continu : 

. d'une liste PRIOREORG des objets £ r6organiser par priorite decroissante 

fonction de retat de desorganisation des objets d reorganiser ; et 
20 • d'une liste PRIOCOPIE des objets & copier par priorite decroissante fonction de 

I'anciennete des dernieres copies des objets a copier. 

(50)- Surveillance en continu de I'apparition dans le systeme d'information de tout 
6v6nement : 

- RAZR=1 pour lequel la selection du premier ou prochain objet a reorganiser POR 
25 doit etre remise en cause, notamment une fin d'une tSche de reorganisation dans 

une region de traitement de reorganisation et/ou la liberation d'une zone de 
traitement pour la reorganisation ou la copie ; et/ou 

- RAZC=1 pour lequel la selection du premier ou prochain objet £ copier POC doit 
etre remise en cause, notamment une fin d'une tSche de copie dans une region de 

30 traitement de copie, une copie prioritaire en fin de reorganisation et/ou la 

liberation d'une zone de traitement pour la reorganisation ou la copie, avec 
pour tout ev6nement RAZR=1, lancement de I'execution du processus IDPOR 
d' identification du premier objet & reorganiser POR ou, si le processus IDPOR est en 
cours d'ex6cution, interruption et nouveau lancement du processus IDPOR ; et/ou 

35 pour tout ev6nement RAZC=1, lancement de I'execution du processus IDPOC 
d'identification du premier objet 3 copier POC ou, si le processus IDPOC est en cours 
d'execution, interruption et nouveau lancement du processus IDPOC ; 
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- le processus IDPOR comportant les operations suivantes : 

(51) • Etablissement d'un planning rapide de reorganisation PRR* a I'aide de la 
liste PRIOREORG et du temps operationnel de reorganisation r6siduel disponible TRR 
dans I'ensemble des regions de reorganisation et d'une liste de selection SELECT/OR 

5 d'objets & reorganiser OR ordonnes par priorites decroissantes optim:$6es en fonction 
du gain de la reorganisation de chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur representatif du taux de desorganisation d'un objet OR par le 
temps de reorganisation de cet objet; 

(52) • Etablissement d'un planning rapide de copie PRC & partir de la liste 
10 SELECT/OR, puis de la liste PRIOCOPIE et dans la limite du temps operationnel de 

copie residuel disponible TRC dans I'ensemble des regions de copie, d'une liste de 
selection SELECT/OC en memoire de type LIFO ou pile pour d'objets £ copier OC 
empiies par priorites decroissantes; 

(53) • Etablissement d'un retroplanning de copie dans lequel pour tout objet 
15 courant a reorganiser extrait de la liste SELECT/OR par priorite croissante, on calcule 

pour chaque region de copie le temps a r6server TCR pour la copie de I'objet OR aprSs 
reorganisation ; 

(54) - Etablissement d'un retroplanning de reorganisation dans lequel pour tout 
objet courant a reorganiser OR extrait de la liste SELECT/OR par priorite croissante 

20 pour favoriser le traitement avance des objets de plus grandes tailles possibles, on 
calcule pour chaque region de reorganisation le dernier d6lai de la region DDR, 
representant dans la fenetre « batch » allouee a la reorganisation « hors ligne » le deiai 
minimal necessaire a la reorganisation de I'objet OR, selon une formulation distincte si 
une copie de I'objet OR en fin de reorganisation doit etre faite ou non; 

25 (55) - Identification de la region de traitement RTR de I'objet courant OR par 

adequation optimisee entre la duree de traitement disponible dans ladite region DRR 
avec la duree de traitement DROR n6cessaire pour la reorganisation de I'objet courant 
OR avec DRR -DDL minimal <0 sans copie a faire ou avec valeur absoiue de DRR - 
DDL minimal et DROR+DCOR < DRR si copie a faire; 

30 (56) - Inscription de I'objet courant OR comme prochain objet a reorganiser POR 

au planning de la region identifiee en valorisant le pointeur POR correspondant a 
I'adresse de I'objet OR, en augmentant la duree de temps consomme DCRR dans la 
region du temps de la reorganisation DROR et recalculant la dur6e gaspiliee dans la 
region de reorganisation DGRR du fait des copies d'objets OR en fin de reorganisation ; 

35 6.0)- Lancement, en I'absence de tout evSnement de remise a z6ro RAZR=1 survenu 
entre temps, des qu'une region de traitement de reorganisation RTR identifiee est 
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disponible, de la reorganisation de I'objet POR ; Remise d z6ro et nouvelle execution 
du processus IDPOR ; et 

• le processus IDPOC comportant les operations suivantes : 

(51) - Etablissement d'un planning rapide de reorganisation PRR* a I'aide de ia 
5 liste PRIOREORG et du temps op6rationnel de reorganisation residuel disponible TRR 
et d'une liste de selection SELECT/OR d'objets 3 rSorganiser OR ordonn6s par 
priorites decroissantes optimis6es en fonction du gain de la reorganisation de chaque 
objet OR, ledit gain etant d6fini comme le produit d'un facteur repr6sentatif du taux de 
desorganisation d'un objet OR par le temps de reorganisation de cet objet; 

10 (52) • Etablissement d'un planning rapide de copie PRC & partir de la liste 

SELECT/OR, puis de la liste PRIOCOPIE et dans la limite du temps operationnel de 
copie residue! disponible TRC, d'une liste de selection SELECT/OC en m6moire de 
type LIFO ou pile d'objets £ copier OC empties par priorites decroissantes; 

(53') - Etablissement d'un retroplanning de copie avec determination des dur6es 

15 de copie disponibles en region copie, depilage de la liste SELECT/OC de haut en bas 
et recherche d'une region copie par adequation entre la dur6e copie disponible et la 
duree copie de I'objet courant £ copier OC de fa$on a copier les objets les plus grands 
possibles et marquage de I'origine de reorganisation ou non de I'objet d copier ; suivi de 
- Identification de la region de traitement RTC de I'objet £ copier par adequation entre 

20 la dur6e de traitement disponible dans ladite region avec la duree de traitement 
necessaire pour la copie de I'objet courant OC; suivie de 

• I'inscription de I'objet courant OC comme le prochain objet a copier POC au planning 
de la region RTC identifi6e en valorisant le pointeur POC correspondant & I'adresse de 
I'objet OC et en diminuant la dur6e de traitement disponible du temps de la copie de 

25 I'objet OC retenu comme POC ; 

(60')- Lancement, en I'absence de tout evfenement de remise d z6ro RAZC=1 survenu 
entre temps, dfcs qu'une region de traitement de copie TRC identifi6e est disponible de 
la copie de I'objet POC; Remise & zero et nouvelle execution du processus IDPOC. 

5. Methode de gestion selon la revendication 4, caract6ris6e en ce qu'elle 

30 integre dans les phases finales de processus IDPOR d'un objet OR une phase de 
recherche d'un ou plusieurs objets & reorganiser OR sans copie OR dans la liste 
SELECT/OR ou a defaut dans la liste PRIOREORG susceptibles d'etre reorganises dans 
la region de traitement RTR correspondante pendant I'intervalle du temps d'attente de 
la copie de I'objet OR apr§s reorganisation. 

35 6. Methode de gestion selon I'une des revendications 4 et 5, caracterisee en 

ce que ladite phase (51) d'6tablissement d'un planning rapide de reorganisation PRR* 
comporte les operations suivantes : 
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(511) - Initialisation : dans laquelle sont notamment annuies les indicateurs de 
selection des objets OR, initialise le compteur-limiteur de remises en causes, les temps 
residuels de copie TRC et de reorganisation TRR et la duree minimale E de 
reorganisation et copie d'un objet OR ; 
5 (512) - Boucle sur objets : dans laquelle notamment pour tout objet reel OR de la liste 
PRIOREORG pris dans I'ordre decroissant jusqu'S ce que TRR < E, une marque de 
'selection possible' de I'objet est posee; 

(513) - Elimination des intersections d'objets : dans laquelle notamment sont eiimines 
de la 'selection possible' les objets reels OR parties d'espaces de tables egalement 

10 appeies objets globaux d£j£ s6lectionnes en tout ou partie; 

(514) - Remise en cause des choix precedents : dans laquelle notamment sont eiimin6s 
de la 'selection possible' les objets OR dont le temps total de reorganisation et copie 
est superieur au temps de reorganisation residuel TRR et a defaut dans laquelle I'objet 
courant OR et les objets OR dejS seiectionnes dans la liste SELECT/OR sont soumis 3 

15 un processus d'optimisation en fonction du gain de reorganisation avec replacement 
d'un objet d6j£ seiectionne par I'objet en cours avec essais, dans la limite du terme du 
compteur-limiteur, de combinaisons successives tendant d retenir pour §tre 
seiectionne au final dans SELECT/OR des objets de plus grand gain de reorganisation 
possible et £ les associer aux autres objets OR de la 'selection possible' de fagon £ ce 

20 que le temps total des reorganisations de tous les objets OR retenus soit inf6rieur mais 
ie plus proche possible du temps residuel de reorganisation TRR. 

(515) - Verification de la suffisance du temps copie disponible dans le temps residuel 
de copie TRC pour chaque objet OR en passe d'etre finalement seiectionne pour la 
reorganisation compte tenu de la priorite de reorganisation de I'objet OR par rapport 

25 aux objets a copier en prealable du fait de leurs priorites copie superieures. 

(516) - Selection de I'objet courant OR dans la liste SELECT/OR : dans laquelle 
notamment sont positionnes les indicateurs de I'objet courant OR et de I'objet global 
associe, annuies eventuellement les indicateurs du ou des objets OR deseiectionnes et 
diminuer TRR et TRC des temps respectifs de reorganisation et de copie. 

30 7. M6thode de gestion selon I'une des revendications 4 a 6 caracterisee en ce 

que ladite phase (52) d'etablissement d'un planning rapide de copie PRC comporte les 
operations suivantes: 

(521) - Initialisation : au sortir d'un planning de reorganisation PRR* et dans laquelle 
sont notamment vid6es les piles de selection de copie PSC1 et PSC2, initialises le 

35 compteur-limiteur de remises en causes, le temps residuel de copie TRC et la dur6e 
minimale EC de copie d'un objet 3 copier OC ; 

(522) - Inspection des regions de reorganisation : Pour toutes les regions, 
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si region active, et si image copie de I'objet en cours de reorganisation d faire et/ou si 
image copie de tout objet OR de la liste SELECT/OR pris dans I'ordre des priority 
d6croissantes £ faire: pour tout sous-objet susceptible d'etre copie s6par6ment, 
notamment une partition, soustraction du temps de copie du sous-objet de TRC et 
5 placement du sous-objet en haut de la premiere pile PSC1 ; 

(523) -traitement de la liste des objets & copier PRIOCOPIE : dans laquelle 
notamment pour tout objet a copier OC de la liste PRIOCOPIE pris dans I'ordre 
d6croissant jusqu'2 ce que TRC < EC et absent de PSC1, soustraction du temps de 
copie du sous-objet OC de TRC et placement du sous-objet OC en haut de la seconde 

10 pile PSC2 , 

(524) - Empilage des piles de selection : dans laquelle la pile PSC1 est superpos§e k la 
pile PSC2 pour constituer la liste SELECT/OC. 

8. Methode de gestion selon la revendication 7 caracterisee en ce que ladite 
phase (53) d'etablissement d ? un retroplanning de copie dans le processus IDPOR 
15 comporte les operations suivantes: 

(531) Initialisation des regions de copie : dans laquelle au sortir d'un planning de 
reorganisation pour toutes les regions de copie, la dur6e consommee de la region 
DCRC est mise a zero, 

(532) Determination du temps de copie a reserver TCR : dans laquelle pour tout objet 
20 reel de la liste SELECT/OR parcourue dans I'ordre des priorites croissantes pris 

comme objet courant £ reorganiser OR, 

•le temps k r6server pour copier TCR I'objet r6el courant OR est mis k zero ; 

-Si I'image copie de tout objet OR de la liste SELECT/OR pris dans I'ordre des priorites 

croissantes doit §tre faite: pour tout sous-objet susceptible d'etre copie separ6ment, 

25 notamment partition, on recherche une region copie dont la dur6e consomm6e DCRC 
est minimale, on ajoute le temps de copie du sous-objet d la duree consomm6e de la 
region courante DCRC et on valorise le temps d reserver TCR pour copie de I'objet 
courant = maximum entre le temps d reserver TCR pour copie de I'objet courant et 
duree consommee dans la region DCRC. 

30 9. Methode de gestion selon la revendication 8, caracterisee en ce que ladite 

phase de retroplanning de reorganisation (54) dans le processus IDPOR comporte les 
operations suivantes : 

(541)- Initialisation : dans laquelle pour toute region de reorganisation, 

- Dur6e de la region DRR = Dur6e de la fen§tre 'batch' DFB moins heure relative 
35 estim6e de fin du traitement de reorganisation en cours dans la region HRFR 

- Duree consommee dans la region DCRR = 0 

- Duree gaspillee dans la region DGRR = 0 
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- Pointeur premier objet d reorganiser de la region courante = 0 

(542)- Determination du dernier d6lai de la region de reorganisation DDRR : dans 
laquelle pour tout objet reel OR s6lectionn6 de la liste SELECT/OR dans I'ordre des 
prioritSs croissantes : 

5 Pour chaque region si I'image copie de I'objet courant OR a faire, calcul du dernier 
deiai de la region DDRR = dur6e de reorganisation de I'objet courant DROR + 
maximum entre le temps & reserver pour copie de I'objet courant TCR et le total de la 
durSe consommee de la region DCRR + la dur6e gaspil!6e de la region DGRR ; 

• Sinon, calcul du dernier deiai de la region DDR = duree consommee de la region 
10 DCRR + maximum entre la duree de reorganisation de I'objet courant DROR et la 

duree gaspiliee de la region DGRR. 

10. M6thode de gestion selon la revendication 9, caract6ris6e en ce que ladite 
phase d' identification de la region de reorganisation RTR (55) comporte les operations 
suivantes : Selon le type d'objet courant a r6organiser OR 

15 (551) - Recherche de la region de traitement de reorganisation susceptible d'accueillir 
de fa?on optimale un objet £ reorganiser OR sans copie : comportant 

- la recherche d'une region dont le dernier deiai DDRR est minimal, et si dernier deiai 
de la region courante DDR est superieur £ la duree de la region courante DRR, la 
recherche d'une region pour laquelle : la valeur de la dur6e de la region courante DRR 

20 moins le dernier deiai de la region courante DDRR est minimale et positive ou nulle ; sinon 
(552) -la recherche de la region de reorganisation susceptible d'accueillir de fa?on 
optimale un objet a r6organiser OR avec copie : comportant 

• Recherche d'une region telle que : la valeur de la dur6e de la region DRR moins 
dernier deiai de la region courante DDRR est minimale en valeur absolue, et la valeur 

25 de la duree de reorganisation DROR plus le temps de copie objet courant TCR est 
infeheur ou egal £ la duree de la region DRR. 

11. Methode de gestion selon la revendication 10, caracterisee en ce que 
ladite phase description de I'objet OR au planning de la region de reorganisation RTR 
(56) comporte les operations suivantes : 

30 (561)- Inscription de I'objet OR comme prochain objet d reorganiser POR : dans 
laquelle si I'image copie de I'objet courant & faire ou duree gaspiliee de la region 
courante 6gale zero, on valorise le pointeur premier objet a reorganiser POR de la 
region courante & I'adresse de I'objet courant OR, 

(562) ■ mise a jour DCRR et DGRR : dans laquelle on ajoute la duree de reorganisation 
35 de I'objet courant DROC d la duree consomm6e de la region courante DCRR, et on 
valorise la duree gaspiliee de la region courante DGRR £ la valeur du dernier deiai de 
la region courante DDRR moins la duree consommee de la region courante DCRR. 



WO 03/085554 



• 



PCT/FR03/01076 



55 



10 



15 



20 



25 



30 



12. Methode de gestion selon Tune des revendications 4 4 7 caract6ris6e en 
ce que ladite phase (53') d'etablissement d'un retroplanning de copie dans le 
processus IDPOC comporte les operations suivantes: 

(531') Initialisation des regions de copie : dans laquelle pour toutes les regions, 

- la dur6e de region DRCOP est valoris6e a la duree fenetre « batch » DFB moins 
Theure relative estimee de fin de traitement copie en cours HRFC, 

- la duree consommSe de la region DCRCOP est mise 3 z6ro, 

- le pointeur du premier objet £ copier POC de la region courante est mis a z6ro 
(532') DSpilage et identification du prochain objet a copier POC : Dans la laquelle, 
Pour tout objet de la pile PSC1/PSC2 parcourue de haut en bas un objet courant 3 
copier OC est extrait lorsque le temps de copie de I'objet courant TCOC est interieur 
ou egal £ la tongue DRCOP; 

On cherche pour identifier la region de traitement copie une region dont la duree 
consomm6e DCRCOP est minimale ; dans I'affirmative si le temps de copie de I'objet 
courant TCOC est sup6rieur d DRCOP moins DCRCOP on cherche une region pour 
laquelle DRCOP moins DCRCOP moins TCOC est minimale, positive ou nulle, 
Si aucune region ne convient, on choisit une region £ copier pour laquelle 
DRCOP moins DCRCOP moins TCOC est negative et minimale en valeur absolue et 
pour laquelle TCOC est inferieur ou 6gal a DRCOP ; 

Si I'objet courant appartient £ la seconde pile PSC2, soit un objet £ copier non issu 
d'une reorganisation, le pointeur de I'objet POC pour la region courante choisie est 
valorise £ I'adresse de I'objet courant OC de fa?on 3 inscrire I'objet POC au planning 
de la region de traitement copie RTC identifiee ; et 

Pour terminer, on ajoute la duree copie TCOC d la dur6e consomm6e de la region 
courante DCRCOP. 

13. Methode de gestion selon Tune de revendications precedentes, 
caracterisee en ce que lesdits 6v6nements internes au systdme RAZR=1 et RARC=1 
entrainant la remise en cause de la selection des objets POR ou POC sont notamment 
constitu6s respectivement par la fin d'une tSche de reorganisation dans une region de 
traitement de reorganisation pour les objets POR ou par la fin d'une tache de copie 
dans une region de traitement de copie pour les objets POC, une copie prioritaire en fin de 
reorganisation et/ou la liberation d'une zone de traitement pour les objets POR et POC. 

14. Methode de gestion des reorganisations d'un ensemble de bases de donnees 
indexees d'un systeme informatique d'information adaptee a la reorganisation « en 
ligne» et destinee a travailler en association avec une methode de gestion selon Tune 
des revendications pr6c6dentes, caracterisee en ce qu'elle comporte au moins les 
phases operationnelles suivantes: 
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- une phase d'analyse instantanSe d'au moins un objet £ reorganiser OR parmi les 
objets susceptibles de reorganisation, notamment bases de donnees, partitions et/ou 
index a reorganiser, et d'estimation du surcout associe au niveau de desorganisation 
de I'objet £ reorganiser OR; 
5 • une phase d'estimation instantanSe du cout de la reorganisation en ligne en fonction 
de la taille dudit objet & reorganiser OR et du taux de disorganisation dudit objet a 
r6organiser OR ; et 

• une phase de determination du seuil Ds de desorganisation minimal de I'objet a 
reorganiser OR au dessus duquel seuil la reorganisation « en ligne » peut §tre lancee 
10 pour cet objet OR et le cas echeant du lancement effectif de cette reorganisation en 
ligne, le seuil Ds correspondant sensiblement au minimum du cout total du surcoQt 
estime de la desorganisation et du cout estime de la reorganisation pour I'objet OR 
considere. 



15 caracterisee en ce que le lancement de la reorganisation « en ligne » est retarde pour 
attendre une fenetre temporelle d'activite reduite de la base de donnees concernee. 

16. M6thode de gestion des reorganisations « en ligne » et « hors line » selon Tune 
des revendications 14 et 15, caracterisee en ce que pour un objet £ reorganiser OR 
seiectionne comme premier objet £ reorganiser POR la priorite est donn6e pour la 

20 reorganisation « hors ligne », Intervention de la reorganisation « en ligne » n'etant 
requise qu'aprfcs depassement du seuil Ds pour I'objet POR considere. 

17. Methode de gestion des reorganisations « en ligne » selon Tune des 
revendications 14 a 16 et utilisee pour la reorganisation des bases de donn6es 
jndex6es d e type espace de tables, la methode etant caracterisee en ce que pour un 

25 objet £ reorganiser OR, le seuil Ds est defini par une approximation donn6e par la 
formule F5' suivante : 
R = Ds 2 r Co* / 2.J.C == 1 

lorsque que U moyenne horaire du nombre de mises 3 jour sur I'objet OR est faible, et 
dans laquelle : 

30 r d6signe le nombre moyen de lignes ou cie-RID par page de I'objet entier, 

I designe le nombre d'insertions de lignes, ou de cie-RID pour les index, £ I'heure dans 
I'objet OR, 

Co* designe le surcout horaire lorsque I'objet est totalement desorganise 
c designe un paramdtre machine, le rapport du temps d'accfes E/S par la taille de 
35 I'objet Nbp. 



15. Methode de gestion des reorganisations « en ligne » selon la revendication 14, 



WO 03/085554 



57 



PCTVFR03/01076 



18. Methode de gestion des reorganisations « en ligne » selon la revendication 17 
et utilis6e pour la reorganisation des index, caracterise en ce que pour un index, le 
seuil Dsl est defini par une approximation donnee par la formule F7'suivante : 
R= Dsl 2 r <t»+l)Nbp.V / [2(V+3)] = 1 
5 lorsque que U moyenne horaire du nombre de mises 3 jour sur I'index est faible, et 
dans laquelle : 

Ts designe le temps de deplacement de bras, Tl le temps de latence (1/2 tour du bras), 
c = (Ts+ 3.TI)/Nbp ou Ts en E/S designe le temps de deplacement du bras du disque, 
et Tl le temps de latence, 1/2 tour du bras, et V = Ts/TI. 
10 t* designe le taux de relecture de I'objet, c'est a dire le nombre moyen de fois qu'une 
entree sera relue. 

19. Methode de gestion des reorganisations « en ligne » selon la revendication 
17 et utilisee pour la reorganisation des bases de donnees indexees de type espace de 
tables monotable d n index, caracterise en ce que le seuil DsT est d6fini pour un 
15 espace monotable par une approximation donnee par la formule F13' suivante : 
R= r.Nbp[DsT 2 .L (V+l) + V. S (DsT 2 -bi*) (t*l+l)]/ (2V+6) = 1 

lorsque que U, moyenne horaire du nombre de mises & jour sur r espace monotable est 
faible, et dans laquelle : 

L designe la proportion de lignes accedees par parcours sequentiel sur le nombre de 
20 lignes creees, 

S represente le signe mathematique Sigma, somme des expressions f(xi) pour i index 
allant de 1 a n, 

bi represented les valeurs instantanees de D, taux de d6sorganisation de Pespace 
monotable, lors des dernieres reorganisations des n index, et 

25 t*i represented les taux d'accds directs au travers de chaque index i. 

20. Methode de gestion des reorganisations dans un ensemble de bases de 
donnees indexees d'un syst6me informatique d'information selon Tune des 
revendications precedentes, caracteris6e en ce qu'elle est appliqu6e d la 
reorganisation de bases de donnees indexees de type espace de tables. 

30 21. Systeme informatique de type systeme d'information caract6ris6 en ce qu'il 

comporte un ensemble de bases de donnees indexees et les moyens materiels et 
logiciels adaptes pour la mise en ceuvre de la methode de gestion des reorganisations 
de base de donnees indexees selon Tune des revendications precedentes, notamment 
de bases de donn6es de type espace de tables et/ou d'index. 
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